フィールドノートにおける場面特徴の表現手法の深化と利活用に関する研究

代表

山田 太造(東京大学史料編纂所・助教)

共同研究員

大向 一輝(国立情報学研究所コンテンツ科学研究系・准教授)、帯谷 知可(京都大学地域研究統合情報センター・准教授)、後藤 真(国立歴史民俗博物館・准教授)、柴山 守(京都大学国際交流推進機構・研究員)、清野 陽一(奈良文化財研究所都城発掘調査部・研究員)、関野 樹(総合地球環境学研究所 研究高度化支援センター・教授)、永崎 研宣(人文情報学研究所・主席研究員)、原 正一郎(京都大学地域研究統合情報センター・教授)、柳澤 雅之(京都大学地域研究統合情報センター・准教授)、山田 太造(東京大学史料編纂所・助教)

期間

平成28年4月~平成29年3月

目的

本研究では、フィールドノートを対象に、記述されている場面の特徴を、テキストマイニング手法を用いることで検出し、表現・解析するとともに、関連情報を提示する手法の確立することで、フィールドノートを軸とした「地域の知」の外在化を目指していく。特に以下の2点に着目する。

1. 場面特徴検出手法の深化:これまで,テキストから時空間語彙とともに用語抽出を行い、その用語をもとに場面のトピックを検出する手法を確立してきた。本研究では新たに、用語抽出において、用語をその状態を示す語とともに抽出していくことで、より場面の特徴付けを深化させていく。
2. 場面特徴の周辺化・細分化および関連データ提示手法の確立:これまで1)で検出した場面特徴を、セマンティックウェブ技術を用いることで多目的に利活用しやすいデータ表現方法を確立してきた。本研究では、場面特徴の周辺化・細分化、フィールドノート内もしくは他データから関連データを提示するなど、利用に応じた特徴提示手法に確立していく。

研究実績状況

[H28年度]
H-GIS研究会と共同して、研究会を6回開催し、人文科学領域における時空間情報に関する処理の可能性について、人文科学および情報学の研究者など多様な研究領域における考え方を洗い出し、さらに研究遂行における問題点についても検討を重ねることでそれらを共有し、研究課題遂行の方向性を見出してきた。また、第111回人文科学とコンピュータ研究発表会(主催:情報処理学会人文科学とコンピュータ研究会)において「地域とその情報」をテーマとした企画セッションを組んだ。ここでは6名から報告がなされ、さらにパネルディスカッションを行い、地域と情報について深く討論していくことができた。さらに、PNC 2016 Annual Conference and Joint Meetingsにおいて「Institutional Linked Open Data」というセッションを組むことができた。ここでは、地域に関する情報に対するセマンティックウェブ技術を用いた検索・プレゼンテーションを中心とした内容で4名からの報告がなされた。

研究成果の概要

[H28年度]
「目的」で述べた、フィールドノートに対する時空間的特徴の定量的表現・解析手法の確立のため、以下の問題に取り組んだ。
1) フィールドノートからの時空間的特徴の抽出と場面の構造化:情報リソースとして、高谷好一著「地域研究アーカイブズ フィールドノート集成2」を利用し、前年度までの研究課題「フィールドノートを対象としたテキストマイニングに関する研究」の成果を取り入れ、対象資料からテキストの構造化、テキスト内に潜在する話題検出手法などを行い、テキストの定量的解析を進めた。また、辞書等の整備がなされていない環境下での地名等の抽出を行う手法を提案しこれを適用した。抽出の精度は実用レベルとはいえないものの、他の史資料とのリンケージ形成において効力を発揮するものであることがわかった。また、他資料として,オープンに利活用できるという観点からWikipediaの記事を用いた。Wikipediaから得られた記事に対しても話題検出手法を適用し、フィールドノートとWikipediaから得られた記事から検出された話題の比較を行うなど、テキスト分析の深化を図った。
2) フィールドノート情報の利用:昨年度までにプロトタイピングを行った情報システムにおけるフィールドノートにおける場面の定量的特徴にもとづいた関連する場面の提示を可能とする情報提示機能を拡張することで、1)で対象としたフィールドノートから抽出した地名を用いて、他の史資料、具体的にはWikipediaの記事へリンクし、さらにそこから検出した話題を提示する機能を付加した。これにより1)で述べた異なるリソース間での話題の比較を可能にした。

公表実績

[H28年度]
○ 研究会・国際会議等
・第111回人文科学とコンピュータ研究発表会企画セッション「地域とその情報」,2016年7月30日,福江文化会館(長崎県五島市).
-報告者:山田太造,後藤真,木村直樹,関野樹,飯島渉,原正一郎
・PNC 2016 Annual Conference and Joint Meetings, session: Institutional Linked Open Data, 2016年8月17日,The Getty Center(アメリカ合衆国).
-報告者:Shoichiro Hara, Makoto Goto, Taizo Yamada, Chao Xu
○電子媒体等
・Sekino, Tatsuki: HuTime (Web API). http://web.hutime.org/

研究成果公表計画, 今後の展開等

[H28年度]
[研究成果公表計画]
フィールドノートの価値を高めることができる手段により本研究における研究成果を公開していきたい。例えば、これまでの研究成果を公表する。これは、2016年度と同様に「地域の知」もしくは「地域情報」に関わる研究会・国際会議において特集セッションを組んでいきたい。さらに、プロトタイピングしてきた情報システムの公開を目指していきたい。
[今後の展開]
本研究ではテキストマイニング手法・話題検出手法はフィールドノートを対象に行なってきた。2016年度は関連する記事としてWikipediaの記事を用いた。今度は新聞やウェブ上の記事などへ適用し、地域における情報の分析を推し進めていく予定である。

 

あわせて読みたい