天天看點

漢典重光古籍數字化平台正式釋出

兩年前,阿裡巴巴與四川大學、美國加州大學伯克利分校、中國國家圖書館、浙江圖書館跨界協作,發起「漢典重光」項目,緻力于尋覓海外流散的中國古籍數字化,推動其以數字化方式“回歸”,讓所有人都能親近古籍。

昨天,我們在國家科技館向大家彙報了項目最新進展:

已經完成首批20萬頁中文古籍善本數字化回歸,這批古籍來自加州大學伯克利分校東亞圖書館,包含40多種罕見的宋元珍本。

漢典重光古籍數字化平台正式釋出

在四川大學曆史文化學院的陳力教授和王果副院長、加州大學伯克利分校東亞圖書館館長周欣平等諸多專家學者與我們的共同努力下,漢典重光研發的古籍識别系統以97.5%的準确率,把20萬頁古籍從掃描圖檔變成線上文本,沉澱了覆寫3萬多字的線上古籍字典。

經過幾輪疊代,現在系統已經能對上百本古籍作批量識别。

漢典重光平台上線了幾項基礎功能:古籍數字化互動式訓練、古籍全文内容檢索、古籍漢字字典。

所有人都可以體驗這個平台,并将你的回報告訴我們:

漢典重光古籍數字化平台正式釋出

特别要說明的是,這個平台屬于全社會。

達摩院院長張建鋒已經宣布,今後,漢典重光古籍數字化平台将捐贈給權威公共機構長期營運。

20萬頁古籍不過滄海一粟,一切隻是剛剛開始。想實作數字時代的“書同文”夢想,要做的事還很多。

阿裡會在古籍數字化工作上持續投入人力物力:

· 通過與美國、歐洲、日本、南韓等有影響力的圖書館合作,擴大古籍回歸的數量;

· 不斷研發古籍數字化技術,提升古籍識别系統的準确率與效率,打造更多友善實用的古籍研究工具。

漢典重光古籍數字化平台正式釋出

在昨天釋出會上,

中國國家圖書館副館長、國家古籍保護中心副主任張志清表示:

古籍數字化是個非常複雜的跨學科課題,涉及到古籍影像文本的分類标引、檢索、挖掘、關聯等多方面資訊技術的應用,需要技術專家與人文學者密切配合才能實作,“古籍數字化呼喚高科技企業參加”。

四川大學校長、中國工程院院士李言榮說:

四川大學與加州大學伯克利分校、阿裡巴巴聯合建立「漢典重光」平台,創造性地開展古籍AI技術的研發和轉換應用。真正聚焦和解決我國古籍文獻因為版本多元、字型多變、印刷多樣造成的識别難、閱讀難、了解難和普及難的問題。

全國政協副主席、九三學社中央委員會常務副主席邵鴻指出:

這是一項具有重要意義的文化盛舉和文化基礎建設工程:2007年,國家 “中華古籍保護計劃”啟動,要求積極利用各種方式将海外所藏中華典籍複制回國。「漢典重光」讓流失海外的文化财富以數字化形式回歸祖國并實作再生性保護,是對中華古籍保護計劃的有力支援,同時也将大大提升我國古籍保護水準。

專家上司的關注支援将推動我們不斷努力。

漢典重光是一個開放的平台,不止針對海外古籍,擁有珍貴文獻的同人、機構也可以在平台上傳文獻,并由達摩院技術将其數字化,豐富平台内容。

最近兩天,我們已陸續接受到許多民間藏書家、藏書機構的咨詢。

特将聯絡郵箱公布于此:

[email protected]

感謝社會各界對這一事業的關注和支援。

古籍浩如煙海,古籍數字化是一個宏大且漫長的工程,需要各方力量持之以恒不斷突破,每一條涓涓細流終将彙聚成傳承曆史與文明的浩瀚海洋。

繼續閱讀