Scroll to Content

Otaru Open City とは

Otaru Open City は、小樽市が公開しているデータやドキュメントを対象として、自然言語処理(情報抽出、自動要約など)の技術を用いて、見やすい情報(グラフや表など)へ加工しながら、信憑性も保つために一次情報に結びつけつつ、情報提供することを目標としています。

YouTubeの字幕から作成したWordCloudによる動画内検索

previous arrow
next arrow
Slider

キーワードを含む発言から動画をスタート

小樽市議会はYouTubeで議会の様子を配信しています。その動画の字幕(書き起こし)を収集し、市長や議員の発言に含まれる頻出語句をWordCloudとして可視化しています。このワード(Word)をクリックすることで、ワードを含む発言から動画をスタートできます。

小樽市議会会議録検索システム

previous arrow
next arrow
Slider

基盤となる検索システム

小樽市議会会議録検索システムは、一般的な文書検索を行うことができ、応用システムの基盤となります。今後は、議員の特徴語を抽出して、その特徴語がどのような文脈で使われているのか検索システムで表示します。また、検索結果からわかる単語出現頻度を用いて小樽市内の地図に反映させる予定です。1つの試みとして、検索システム内では、地域別に頻度を表示するクロス表検索(試作版)を実装しています。

議会発言の特徴語

previous arrow
next arrow
Slider

TFIDFによる計算式

小樽市議会議員の活動の実体を可視化する試みの一つとして、議会会議録に含まれる発言から、特徴語のリストを作成しました。

ここで、特徴語とは、それぞれの議員の発言に含まれる単語を比較して、対象議員だけが利用している特徴的な単語です。これは、各議員が注力している分野や課題をみつける手がかりとなります。議員の特徴語を見つける手順は、形態素解析により、単語に分割し、名詞の単語のみを抽出して、TFIDFによる計算式を用いて、値が高い上位の単語をリストにします。

小樽市人口可視化マップ

https://otaru-open.city/wp-content/uploads/2020/08/map-2-900x600.jpg

小樽市のオープンデータを利用し、地域ごとに人口を可視化したWEB上のマップを作成しました

固有表現抽出

https://otaru-open.city/wp-content/uploads/2020/08/namedentity-952x516.png

小樽市のオープンデータから固有表現を抽出し、それを固有名詞(人名、組織名、地名など)や日付、時間表現、数量、金額、パーセンテージなどのあらかじめ定義された固有表現分類へと分類します。

小樽市のオープンデータについて

//otaru-open.city/wp-content/uploads/2020/03/opendate_mac.png

【以下、小樽市ホームページより】

本市が保有する情報を、機械判読可能で二次利用が容易な形式のオープンデータとして公開し、その利活用が進展することで、サービス又はビジネスが新たに創出されることが期待でき、市民生活の利便性の向上及び経済の活性化の実現を可能とします。

製作チーム

プロデュース 木村 泰知 小樽商科大学 商学部 社会情報学科 教授
検索システム 乙武 北斗 福岡大学 工学部 電子情報工学科 助教
コーディング 福家 祐紀 小樽商科大学 木村ゼミ
サーバ構築 笠原 有真 小樽商科大学 木村ゼミ
3Dモデリング 蒲田 躍斗 小樽商科大学 木村ゼミ
データ処理・解析 桧森 拓真 北海道大学 大学院
データ解析 永渕 景祐 小樽商科大学 木村ゼミ
データ整理 加藤 正宙 小樽商科大学 木村ゼミ
マップデータ製作 佐々木啓人 小樽商科大学
WEBサイト製作 森谷 亮介 合同会社 Nita Limo