ronbun yomu

言語学(主に日本語文法史)の論文を読みます

北本朝展ほか(2017.12)時系列史料の人機分担構造化:古典籍『武鑑』を参照する江戸情報基盤の構築に向けて

北本朝展、堀井洋、堀井美里、鈴木親彦、山本和明(2017.12)「時系列史料の人機分担構造化:古典籍『武鑑』を参照する江戸情報基盤の構築に向けて」『じんもんこん2017論文集』

要点

  • 時系列的な広がりを持つ資料群の分析に、人手の限界があるので「人機分業」する必要がある
    • その際、板本間の差分の比較にテキストベース差分検出ではなく画像ベース差分検出を用いることを提案(自分の興味としてはここ)
  • 他、情報基盤としての展望

手法と展望

  • 国文学研究資料館歴史的典籍NW事業」に関して、コンテンツ検索のためにはデータの構造化(デジタル化、テキスト化、機械可読的なデータ化)が重要
  • ここでは『武鑑』を事例とする
    • 江戸の武家名鑑で、17世紀中頃から慶應3(1867)年まで、200年にわたって出版
    • ソフトウェア工学のバージョン管理と板本の刊・印・修を照らし合わせる(2.2)
    • 非文字情報を扱うため、テキストベースではなく画像ベースで差分検出を行う
      • OpenCV2.4, 特徴点検出にはFAST, 特徴記述にはBRIEF, マッチングにはハミング距離(全探索), 2 枚の画像の射影変換行列の推定にはRANSAC
      • 重ね合わせた画像に対して、両方向の差分をカラーで強調するとともに、差分が小さい画素は白で表示することで背景化
        f:id:ronbun_yomu:20180821105315p:plain
        (p.277)
    • こうした差分検出は、例えば翻刻作業などで威力を発揮する
  • 展望として、
    • 大名家情報と位置情報などの紐づけ
    • 参勤交代のアニメーション化 codh.rois.ac.jp