PDF文件字?jǐn)?shù)統(tǒng)計(jì)
使用word統(tǒng)計(jì)字?jǐn)?shù)很方便,但是很多情況下,譯員接到的稿件都是PDF格式的文件,其字?jǐn)?shù)統(tǒng)計(jì)是一件很麻煩的事情,今天這一篇,譯聲翻譯公司來和大家一起聊一聊如何統(tǒng)計(jì)PDF文件的字?jǐn)?shù)。
1什么是PDF?
根據(jù)維基百科上的定義,便攜式文檔格式(英語:Portable Document Format,簡稱PDF)是一種用獨(dú)立于應(yīng)用程序、硬件、操作系統(tǒng)的方式呈現(xiàn)文檔的文件格式。[2]每個PDF文件包含固定布局的平面文檔的完整描述,包括文本、字形、圖形及其他需要顯示的信息。
2PDF字?jǐn)?shù)如何統(tǒng)計(jì)?
我們來看一看網(wǎng)友們在面對這一問題時(shí)都是怎么做的?為了統(tǒng)計(jì)PDF的字?jǐn)?shù),看來大家也是蠻拼的。
再來看看某翻譯公司對PDF文件的統(tǒng)計(jì)方法:
3給您支招
1. 轉(zhuǎn)換大法
將PDF文件另存為txt、doc、rtf等格式的文檔,然后在word中進(jìn)行字符統(tǒng)計(jì)。
PDF文件由于其自身特殊性,在轉(zhuǎn)換成其他格式時(shí),容易產(chǎn)生亂碼、文字丟失等現(xiàn)象,影響統(tǒng)計(jì)準(zhǔn)確性。例如:在轉(zhuǎn)換時(shí),原本覆蓋在圖片上的字體,往往嵌在圖片里,形成新的圖片,此時(shí)這部分字?jǐn)?shù)無法得到統(tǒng)計(jì)。
2. 復(fù)制粘貼大法
呃在文檔不算太長的情況下,勉強(qiáng)算是一種方法吧。
3. 借助在線工具大法
值得一提的是,為了解決PDF文檔字?jǐn)?shù)統(tǒng)計(jì)上的困難,許多網(wǎng)站都提供在線字?jǐn)?shù)統(tǒng)計(jì)功能。如http://wordcounttools.com/,在頁面上點(diǎn)擊select a file按鈕即可上傳文檔,支持docx、pptx、xlsx、pdf、txt等多種格式。上傳完成后,在網(wǎng)頁右側(cè)會顯示出統(tǒng)計(jì)結(jié)果,如圖所示:
需要注意的是,該網(wǎng)站僅對英文字符的統(tǒng)計(jì)效果較好,對中文的支持并不理想。它會將所有的中文字符都作為Characters統(tǒng)計(jì),而將空格和換行符等作為Word的分隔標(biāo)志,所以此處的Words并非真正的詞匯數(shù),而僅僅是由空格劃分的語塊數(shù)。
4. PDF閱讀器內(nèi)置功能大法
看了上面幾種方法,你可能會問,難道就沒有一種像Word那樣,只需輕輕一點(diǎn)即可方便快捷統(tǒng)計(jì)字?jǐn)?shù)的方法么?還真有!經(jīng)過不斷嘗試,筆者發(fā)現(xiàn)最新版本的福昕閱讀器增加了字?jǐn)?shù)統(tǒng)計(jì)的功能,直接點(diǎn)擊視圖選項(xiàng)卡的字?jǐn)?shù)統(tǒng)計(jì)按鈕,即可統(tǒng)計(jì)整篇文檔的字?jǐn)?shù);如需統(tǒng)計(jì)某段文字的字符數(shù),可先選中該段落,再點(diǎn)擊該按鈕。如圖所示:
行業(yè)新聞相關(guān)問答
問:如果翻譯的稿件只有幾百字,如何收費(fèi)?
答:對于不足一千字的稿件,目前有兩種收費(fèi)標(biāo)準(zhǔn): 1)不足一千字按一千字計(jì)算。 2)對于身份證、戶口本、駕駛證、營業(yè)執(zhí)照、公證材料等特殊稿件按頁計(jì)費(fèi)。
問:請問貴司的筆譯范圍?
答:筆譯翻譯又稱人工筆頭翻譯, 既通過文字形式的翻譯轉(zhuǎn)換, 把源語言翻譯成目標(biāo)語言, 是當(dāng)今全球經(jīng)濟(jì)發(fā)展, 政治文化交流的主要方式, 筆譯通過文字展現(xiàn)方式, 使全世界上千種語言能夠互通有無, 每天都有數(shù)以億計(jì)的文字被翻譯或轉(zhuǎn)譯, 筆譯肩負(fù)著世界各國經(jīng)濟(jì)文化發(fā)展的重任, 是各國各民族的文化大使, 我們的筆譯領(lǐng)域涉及十大類專業(yè)領(lǐng)域和五百多種不同的分領(lǐng)域。
問:是否可以請高校教師、學(xué)者或?qū)W生翻譯?
答:絕對不能,風(fēng)險(xiǎn)自負(fù)。許多公司在尋找譯者時(shí),首先想到的是當(dāng)?shù)貙W(xué)?;虼髮W(xué)的外語院系。有時(shí),這種做法對于供內(nèi)部使用的翻譯可能有效,即,您只想了解文件大意,但對于正式的公司宣傳材料、手冊或者合同文檔而言,這樣做卻風(fēng)險(xiǎn)極大。外語教學(xué)需要有特殊的技能,但這些技能卻與翻譯一篇流利、優(yōu)美的文章所需的技能完全不同。讓學(xué)生來做翻譯看起來經(jīng)濟(jì)實(shí)惠,但風(fēng)險(xiǎn)更高,因?yàn)樗麄兒翢o實(shí)戰(zhàn)經(jīng)驗(yàn),翻譯出來的文件基本無法使用。
問:翻譯交稿時(shí)間周期為多長?
答:翻譯交稿時(shí)間與您的文件大小以及復(fù)雜程度有關(guān)。每個專業(yè)譯者的正常翻譯速度為3000-4000中文字/天,對于加急的大型項(xiàng)目,我們將安排多名譯員進(jìn)行翻譯,由項(xiàng)目經(jīng)理將文件拆分成若干文件,分配給不同的譯員進(jìn)行翻譯,翻譯后由項(xiàng)目經(jīng)理進(jìn)行文件的合并,并經(jīng)統(tǒng)一術(shù)語、審校、質(zhì)控、排版等翻譯流程,最終交付給客戶。
問:提供一個網(wǎng)站的網(wǎng)址,能夠給出翻譯報(bào)價(jià)嗎?
答:對于網(wǎng)站翻譯,如果您能提供網(wǎng)站的FTP,或您從后臺將整個網(wǎng)站下載打包給我們,我們可在10分鐘內(nèi)給出精確報(bào)價(jià)。同時(shí),只要您提供原始網(wǎng)頁文件,我們會提供給您格式與原網(wǎng)頁完全一致的目標(biāo)語言版本,可以直接上線使用,省卻您的改版時(shí)間。
問:為什么標(biāo)點(diǎn)符號也要算翻譯字?jǐn)?shù)?
答:①根據(jù)中華人民共和國國家標(biāo)準(zhǔn)GB/T 19363.1-2003 對翻譯行業(yè)服務(wù)規(guī)范的要求,中文字?jǐn)?shù)統(tǒng)計(jì)是以不計(jì)空格字符數(shù)為計(jì)算單位的。標(biāo)點(diǎn)符號算翻譯字?jǐn)?shù)是統(tǒng)一的行業(yè)標(biāo)準(zhǔn)。
②標(biāo)點(diǎn)符號在不同的語種中,有不同的表達(dá)方式,例如中文的標(biāo)點(diǎn)符號大多是全角的,英文的無特殊設(shè)置都是半角的,而且如果一句話或一段內(nèi)容夾雜兩種不同的語言,標(biāo)點(diǎn)符號的規(guī)則就相對復(fù)雜,對于翻譯文件來說,標(biāo)點(diǎn)符號的部分也是很費(fèi)時(shí)。
③另外,標(biāo)點(diǎn)符號在句子中對句子語境等的限制因素,使得標(biāo)點(diǎn)對句子、對譯員翻譯判斷等起到一定的要求。所以,該部分也要計(jì)算在內(nèi)。
④可能我們平時(shí)不是很注重標(biāo)點(diǎn)符號,其實(shí)在文字表達(dá)中,標(biāo)點(diǎn)符號的重要不亞于單字單詞,一個標(biāo)點(diǎn)符號可以改變?nèi)湓挼囊馑?,而我們的工作也是做到了這一點(diǎn),保證每個標(biāo)點(diǎn)符號的準(zhǔn)確,保證譯文表達(dá)的意思和原文一樣。
問:需要與你們公司什么人接洽翻譯業(yè)務(wù)呢?
答:我們公司采取專屬客服服務(wù)模式。為企業(yè)客戶配備專屬客服,一對一溝通具體翻譯需求,組建專屬譯員團(tuán)隊(duì)。
問:為何每家翻譯公司的報(bào)價(jià)不一樣?
答:大家都知道一分價(jià)格一分貨,在翻譯行業(yè)里更為突出,譯員的水平是劃分等級的。新開的翻譯公司或不具備翻譯資質(zhì)的公司為了搶占市場,惡意攪亂,以次充好,低價(jià)吸引客戶。
問:為什么數(shù)字、字母也要算翻譯字?jǐn)?shù)?
答:根據(jù)中華人民共和國國家標(biāo)準(zhǔn)GB/T 19363.1-2003 對翻譯行業(yè)服務(wù)規(guī)范的要求,中文字?jǐn)?shù)統(tǒng)計(jì)是以不計(jì)空格字符數(shù)為計(jì)算單位的。而數(shù)字、字母也是包含在其中。而對翻譯公司來說,數(shù)字和字母也要算翻譯字?jǐn)?shù)的原因還包括以下兩個方面:
首先,我們的收費(fèi)都是根據(jù)國家頒布的翻譯服務(wù)規(guī)范來收取翻譯費(fèi)用,對待收費(fèi)我們都是統(tǒng)一對待的,其次,數(shù)字和字母也是文章中的一部分,特別是在一些商務(wù)文件中,數(shù)字就是文件的主題,所以也是一樣要收費(fèi)的。
另外,純數(shù)字字母需要核對、錄入,比翻譯一個詞語更麻煩,翻譯是大腦里面概念形成的,而純數(shù)字字母是要嚴(yán)謹(jǐn)?shù)暮藢?、錄入才能?shí)現(xiàn)的,這將會花費(fèi)更多的時(shí)間,所以我們會把數(shù)字和字母也算成字?jǐn)?shù)。
但是有一種情況除外,如審計(jì)報(bào)告里面那種數(shù)據(jù)很多而且又不需要我們翻譯可以直接保留的,這部分我們可以不計(jì)算在內(nèi)。
問:請問貴司每天的翻譯量是多少?
答:我們公司最高翻譯記錄為一天翻譯50萬字。原則上我們會在約定的時(shí)間內(nèi)完成,但是時(shí)間和質(zhì)量是成正比的,慢工才能出細(xì)活,我們建議在時(shí)間允許的情況下,盡量給譯員充足的翻譯時(shí)間,以便交付優(yōu)質(zhì)的譯文。