小樽市議会会議録検索システムを公開しました。

「いまさら、会議録検索システムを作成して意味があるのか?」と思われるかもしれませんが、小樽市の場合、意味があるのです。小樽市の議会会議録は、PDFで提供されており、検索機能がありません。

私たちは、以前から、地方議会会議録を対象としたコーパス構築に関する研究をしており、それらのコーパスを用いて、地方議会における政治課題を解決する上で適切な情報を提示するタスクの設計も行っています。小樽市議会会議録検索システムは、福岡大学の乙武北斗先生が、地方議会会議録コーパスプロジェクトの成果として公開した検索システム「ぎ〜みる」を小樽市用に変更してくれました。

(機能紹介について追記予定)

ここで、会議録検索システムの作成手順について説明します。検索システムの元となる会議録の文章は、小樽市議会議会事務局の職員さんが作成しています。この会議録文書を小樽市と小樽商科大学との包括連携という名目で提供してもらいました(感謝)。提供してもらった会議録のファイル形式は、Word(拡張子がdoc、あるいは、docx)なので処理しやすい形式(ここではCSV形式)に変換する必要があります。WordファイルからCSV形式への変換は、桧森さんと永渕さんに担当してもらいました。余談ですが、当初は、小樽市議会のウェブサイトで公開されているPDFファイルからテキストへ変換して、その後に、テキストからCSVへ変換することを考えていました。しかし、この方法は、PDFファイルに含まれるヘッダーやフッターの除去や変換時の文字化け対策が必要になります。これらの対策をするべきか悩んでいましたが、議会事務局から提供してもらった元データのWordファイルのおかげで、作業がかなり楽になりました。

今後の課題は「データ更新」の方法です。