ronbun yomu

言語学(主に日本語文法史)の論文を読みます

国会図書館デジコレから全文テキストをダウンロードするだけのブックマークレット

リニューアルに際して、ブックマークレットの箇所も更新しました。(2022/12/21)

使えなくなってたのでまた更新しました。(2023/01/05)

これは何の記事

国会図書館次世代デジタルライブラリーで古典籍が検索できるようになって、いよいよすごいことになっている。

まじでいいんですか?

次世代デジタルライブラリー上でテキストのダウンロードもできる(右下の「この資料の全文テキストデータ」をクリック)のだけれど、ページが本文検索をメインとした作りになっていて、「資料を探してテキストをダウンロード」するのがちょっとめんどくさいので、ブックマークレットを作って対応する。

使い方

  1. ブラウザでブックマークを追加して、URLに以下のコードをペースト(タイトルは適当でOK)
javascript:(function(){location.href=location.href.replace(/dl.ndl.go.jp\/pid\/(.+?)\/.+$/,"lab.ndl.go.jp/dl/api/book/fulltext/$1");})();

2. デジタルコレクションで好きなページを開いて、1で作ったブックマークレットをクリック (データが用意されてない場合は This PID is not allowed と出ます)

qiita.com

なんてことないブックマークレットで、多分デジコレ側にもそのうちダウンロード機能が付くのではないかと思いますが、それまでの繋ぎとしてどうぞ。

以下のリンクで試してみてください。 dl.ndl.go.jp

まとめてダウンロードしたいときは先にリストを https://lab.ndl.go.jp/dl/api/book/fulltext/[PID] の形でまとめておいて、以下のようなツールでまとめて開くと楽かもしれません。(力技…)*1

www.websiteplanet.com

bamka.info

*1:とりあえずページだけ用意されていてテキストがない、みたいなのがあるっぽくて、その場合は空のデータが返ってきます