“或許還需進幹預,但作強度已經,們以通過拍照,掃描等方式,將僻字圖片掃入計算機,讓程序分析,最後得到標準點陣字,編碼之後加入到字庫當,對字庫進擴充。”
“實現這個功能需幾個提,第就字庫當夠樣本,這個們已經已經完成,因為們現已經萬個標準點陣字字稿。”
“還拿《康熙字典》來舉例,們先將《康熙字典》每個單字掃描圖掃入文字識別係統,然後提取其字體參數特征,再將這些參數賦給已標準點陣字,讓係統計算根據這些參數産‘係統字’。”
“再拿這些成‘係統字’,與‘掃描字’進驗,通過萬個標準字成‘係統字’,驗證參數代表性,最後將參數調到最佳。”
“得到參數體係之後,們就能夠將套掃描進來字,最終得到《康熙字典》全部萬個單字標準點陣字,字庫就從萬擴充到萬。”
“這個倒穎,然而卻也。”麥川點頭:“過還問題,就儲運算。”
“也拿《康熙字典》來舉例,萬個單字,就萬張圖片,們就拿張圖片兆來計算,這就g空間,這也太怕。”
“王院長覺得,這個係統圖片儲容量,以被接受呢?”
“個g,”麥川脫而,覺得實點欺負:“最最,兩個g。”
g,兩百張圖片,兩g就張。
“也就說,如果按照這個標準,這個係統能夠次同時完成百個字掃描分析成字入庫作?”
“還得分串並。”李紅已經套,開始索程序作方式:“涉及到時間成本,學也能將限計算資源全拿來這事兒。”
“們以像級求助呢?”周至問:“們先把基礎作好,然後申請國級運算資源來完成,沒機會呢?”
“國資源更緊張,全國無數單位排隊呢。”麥川苦笑著搖頭。
辜老說:“幹脆這樣,們將作再細點,肘子說這個文字識別反向推算點陣字程序咱們先緩緩,第步先集精力把標準定來。”
“與此同時,們這邊,再把現萬字稿擴到萬。”
“李邊,抓緊先開發讀字稿程序,咱們先把萬字稿數字化作完成。”
“之後再拿著這萬漢字數字化成就,跟個統碼聯盟談判,並且留夠步繼續拓展空間,力爭讓們字庫成為全球統標準。”
“這個字庫,咱們再制定幾個子集,滿國內國際同應用場景需求。到此們第步作就算完成?”
“至於肘子說文字識別,也相當。”辜振鐸補充:“這個們步搞典籍數字化神器啊!”
辜老由得歎氣:“這資源限,怕排嘛?”
“也定。”周至說:“咱們以將這些都給股腦兒報,咱漫價,等著部委落還錢,取乎其,得乎其嘛!”
老們都哄笑起來,這肘子懂部委,拿捏,百分之百滿求,幾乎都能,能夠滿成都開恩。
Copyright © Fantitxt小說 All rights reserved.新筆趣閣網站地圖