

光學特徵識別的實驗應用(OCR)
光學特徵識別的實驗應用(OCR)
該應用程序是我幾年前開發的實驗應用程序,它證明了使用Tesseract OCR引擎來識別設備攝像頭捕獲的圖像中的文本。
該應用程序在您的設備上運行OCR - 無需將圖像上傳到服務器 - 適合識別單個單詞或短語文本,但此應用程序旨在為對OCR感興趣的業餘愛好者和軟件開發人員而不是對一般觀眾感興趣。
與Google的移動視覺API相反,該應用程序可以在離線時識別以非基於非拉丁字體打印的文本。為了實現這一目標,該應用程序包含了多種語言的異常大量培訓數據。此培訓數據存儲在您的手機上,並且該應用程序比普通應用程序佔用更多的空間。
在將捕獲的圖像框架移交給Tesseract之前,該應用程序沒有執行圖像預處理,因此該應用不會針對任何特定的用例調整,因此,其識別精度和速度在很大程度上取決於諸如透視,照明和字體類型之類的情況因素。
該應用程序的源代碼可在GITHUB上獲得(可容納GitHub文件尺寸限制的較小更改)。該應用程序的代碼是來自Zxing條形碼掃描儀項目的開源攝像頭相關代碼和Tesseract OCR項目中的開源光學字符識別代碼的組合。
文字捕獲
默認的單發捕獲量在單擊快門按鈕(如常規照片)時捕獲的快照圖像上運行OCR。
當檢查“連續預覽”複選框時,該應用顯示了設備在相機取景器旁邊識別的東西的動態實時顯示。連續預覽模式在快速設備上最有效。
使用此應用
•將設備指向文本的小區域,然後觸摸屏幕快門按鈕以啟動OCR。
•要識別中文/日語/韓國字符,請將頁面細分模式設置為“單個字符”。
識別準確性
•各種因素可能導致OCR失敗:不均勻的照明,風格化的文本或文本,而背景沒有足夠的對比度。嘗試具有良好的照明。
•保持設備穩定,並確保圖片焦點。
•如果您需要掃描大量文本或整個文檔,請嘗試使用文檔掃描應用程序,例如文本童話。
語言
•該應用支持Google Translate未識別的幾種語言/腳本。
•OCR支持的語言:
南非荷蘭語
阿爾巴尼亞人
阿姆哈拉語
阿拉伯
阿薩姆人
亞塞拜然
阿塞拜疆(西里爾)
巴斯克
白俄羅斯人
孟加拉
波斯尼亞
保加利亞語
緬甸
加泰羅尼亞
宿務
切諾基
中文(簡化)
中國(傳統)
克羅地亞人
捷克
丹麥語
荷蘭
Dzongkha
英語
英語,中間(1100-1500)
世界語
愛沙尼亞人
芬蘭
法蘭克人
法語
法語,中間(約1400-1600)
加利西亞人
格魯吉亞人
格魯吉亞 - 老
德語
希臘語,古代(-1453)
希臘人,現代(1453-)
古吉拉特語
海地
希伯來語
印地語
匈牙利
冰島
印度尼西亞
Inuktitut
愛爾蘭人
意大利人
意大利人 - 老
日本人
爪哇人
卡納達語
哈薩克
高棉
韓國人
庫爾德
吉爾吉斯
寮國
拉丁
拉脫維亞
立陶宛語
馬其頓
馬來語
馬拉雅拉姆語
馬爾他
馬拉地語
尼泊爾
挪威
奧里亞
Pashto
波斯語
拋光
葡萄牙語
旁遮普
羅馬尼亞人
俄語
梵文
塞爾維亞
塞爾維亞(拉丁)
僧伽羅
斯洛伐克
斯洛文尼亞人
西班牙語
西班牙語 - 老
斯瓦希里語
瑞典
敘利亞
他加祿語
塔吉克
泰米爾人
泰盧固語
泰國
藏
tigrinya
土耳其
烏克蘭
烏爾都語
Uyghur
烏茲別克
烏茲別克(西里爾)
越南人
威爾士語
意第緒
三星設備註意
•在三星Galaxy設備上,您可能需要長時間按下菜單按鈕以設置首選項。
•如果您取消檢查“標準焦點模式”,則可能會獲得更好的結果。
天使雕像是一張有趣的冒險地圖,將恐怖和冒險的遊戲元素相結合,為玩家提供精彩的體驗。地圖基於系列經典的恐怖故事,並且未來可能會添加更多的相關內容。如果你正在尋找類
寒冰怪物——一個簡單的怪物材質包凋零骷髏惡魂骷髏苦力怕烈焰人流浪者末影蟎末影人潛影貝(包括飛彈)史萊姆守衛者遠古守衛者蜘蛛
Modern Warfare現代戰爭材質包有很多的槍支。 1.AK-M2.M4A13.KRISS Vector4.AWM5.M1911A1目前還只有這幾把武器
PencilPackHandDrawn資源包1.14.4/1.13.2為我的世界是一個非常不尋常和有趣的包。 這絕對是一個非常新鮮和新的世界的Minecraft
土地(BeyondTheLands)資源包1.14.4/1.13.2確實是最好的中世紀包在那裡目前。 這是一個令人敬畏的紋理包,有許多利益相關者與一些驚人的視覺
胖胖胖的臉頰(ChubbyCheeks)資源包1.16.5/1.15.2用更好、更高質量的替代品取代舊動物模型。 隨著遊戲的年齡增長,遊戲中的友好動物變得越來越
在我們的網站上,您可以輕鬆下載最新版本的OCR Test!無需註冊和發送簡訊!