2022年11月11日 14:11

凸版印刷は、明治期から昭和初期(以下近代)の手書き文字に対応したAI-OCRを開発した。

近代に作成されたくずし字を多く含む手書きの資料は、全国に大量に残存しており、その中には公文書、企業経営文書、業務日誌、書簡のような貴重な情報が記された資料が数多く含まれている。また、手書きの謄本類を取り扱う業務においては、近代の手書き資料の解読が日常的に行われているが、これら資料の解読は、専門家にとっても難易度が高く手間のかかる作業であり、実用レベルのOCR技術もこれまで開発されていなかった。今回、凸版印刷は、そのような課題を解決するため、神戸大学経済経営研究所附属企業資料総合センターおよび三井文庫との共同研究のもと、学術研究や業務の効率化をはかるため、近代のくずし字を解読するAI-OCR技術を独自に開発した。

近代の手書き資料には、くずし字で記されているものが多く、江戸時代の資料より解読が困難な場合もあると言われている。今回のAI-OCRは、現在凸版印刷が古文書解読とくずし字資料の利活用サービス「ふみのは」として提供している江戸時代のくずし字を対象としたAI-OCRをもとに、近代の多様な筆跡の手書き文字にまで対応の範囲を拡張させたもの。今後、神戸大学経済経営研究所附属企業資料総合センター等との実証実験を11月より実施、2023年4月より正式サービス開始を予定している。

「ふみのは」について