サービスコンピューティング研究専門委員会 第11回研究会
- テーマ: 「LinkedData,LinkedServices」および一般参加募集
- 日程: 2014年8月20日(水)
- 場所: 国立情報学研究所(NII)12F会議室(1210/1208)
- プログラム:
◇13:00 - 13:05 オープニング 松原 繁夫 (京大)
◇13:05 - 13:55 【招待講演】
「しゃべってコンシェルの知識Q&A機能」
NTTドコモ 研究開発センター サービス&ソリューション開発部 主査
内田 渉 様
概 要:
NTTドコモが提供する音声エージェントサービス「しゃべってコンシェル」では、
ユーザの自然な音声発話による質問に回答する知識Q&A機能が提供されている。
本講演では知識Q&A機能の概要ならびに、発話の内容を解析し質問に対する回答
そのものを提示する質問応答技術について紹介する。
また、サービス公開後の各種フィードバックに基づく機能開発についても紹介し、
機能開発やデータ準備において得られた課題認識について述べる。
(休憩5分)
◇14:00 - 16:05 【AI/SC セッション】(発表各25分)座長:川村 隆浩(東芝)
14:00 - 14:25
クラウドソーシングを用いたレガシーオープンデータの機械可読化
○小山 聡(北大),馬場 雪乃,大向 一輝(NII),鹿島 久嗣(京大)
概 要:
多くの国々においてオープンデータの取組みが進んでおり、様々な統計データ
が行政等によって公開されている。しかしこれらのデータは画像やpdfの形式で
与えられるものが少なくなく、分析やサービスの開発などでの再利用を妨げて
いる。そこで、クラウドソーシングを用いて、画像として与えられたレガシー
な統計データを機械可読な表形式に変換する枠組みを提案する。その際、作業
者に表だけを作成させるのではなく、画像をスプレッドシート上でグラフとし
て視覚的に再現させるタスク設計を行った。このタスク設計により、データの
誤りに気付き易くなる効果に加えて、再現されたグラフオブジェクトのプロパ
ティとして項目名や系列といったデータの構造を容易に取り出し、作業結果の
統合や品質管理に利用することが可能となる。国土交通省が公開している観光
白書を対象に評価実験を行い、提案手法の有効性を検証した。
14:25 - 14:50
複数モデルの組み合わせによる仮想化システムの性能評価
○木村 大地,沼田 絵梨子,細野 繁(NEC)
概 要:
複数の仮想マシン(VM)による物理リソース共有が及ぼす影響と、VMの組み合わ
せ方による影響を同時に考慮した、仮想化システム性能評価手法を提案する。
ホワイトボックス(WB)的手法では前者の影響が、ブラックボックス(BB)的手法
では後者の影響が考慮できない。各VMをWB的、物理リソースをBB的にモデル化
することで、前述の問題を解決した性能評価ができたことを実験で示し、複数
のモデルを用いる有効性を明らかにする。
14:50 - 15:15
サービスコンピューティングアプリケーション開発のための画像ファイル操作
コンポーネントの整備
○須永 宏,細川 眞由子(阪工大)
概 要:
Webやスマートフォンアプリケーションを構築するに当たっては画像ファイル
を扱うことが通常であり,これを容易に扱えるようにしておけば,アプリケー
ション開発の効率化が図れる.よって,本報告では,この目的の実現を図る体
系化を進める.
15:15 - 15:40
LODを用いたテンソル分解手法
○中辻 真(NTT)
概 要:
本稿は,テンソル分解の精度を向上させるために,オブジェクトの背景にあるセ
マンティクスをテンソル分解に用いる試みを述べる.そして,人間の行動予測
問題に適用する.
15:40 - 16:05
LOD検索の高速化のための機構を備えたSPARQLエンドポイントにおけるクエリ
実行性能の解析
○山形 祐史,福田 直樹(静岡大)
概 要:
SPARQLクエリを用いた推論付きLOD検索は,計算の複雑性の高さなどの課題が
ある.クエリによってはエンドポイントへの負荷が高まり,検索結果を得るま
でに多くの時間を必要とする場合があり,効率的なクエリへの変換が必要とさ
れる.本研究ではオントロジーに基づく推論を利用したLOD検索に伴うエンド
ポイントへの負荷を軽減するクエリ最適化における性能の解析について述べる.
(休憩10分)
◇16:15 - 18:30 【SWO セッション】座長:大向 一輝(NII)
16:15 - 16:50 SIG-SWO-A1401-01(35分発表)
Linked Open Data のためのSPARQLクエリ共有システムの提案
○濱崎 雅弘,後藤 真孝(産総研)
概 要:
本論文では,Linked Open Data (LOD) のためのSPARQLクエリ共有システム
を提案する.LODは様々な応用が期待されるが,膨大かつ多様なデータセット
であるため,適切なクエリを作成するのは容易ではない.提案システムは,
SPARQLクエリを共有し検索・推薦可能にすることで,一部の熟練ユーザが作成
したSPARQLクエリの多くのユーザが利活用できるようにする.
16:50 - 17:15 SIG-SWO-A1401-02(25分発表)
データ市場のための概要記述とLinked Data
劉 暢,大澤 幸生,○野神 航一(東大)
概 要:
データの概要記述を用いた、データ活用シナリオを創造するワークショップ技
法により、公開非公開を問わず有用なデータが共有・取引されるデータ市場の
創出を目指す。本稿では、非公開データの概要記述を介してデータをRDFで結
び付ける仕組みを提案する。
17:15 - 17:50 SIG-SWO-A1401-03(35分発表)
Tangled String: データジャケットを用いたイノベーションゲームからのデー
タ可視化手法創成
大澤 幸生,○平岡 美那子,野神 航一,劉 暢,早矢仕 晃章(東大)
概 要:
データジャケットを用いたイノベーションゲーム(IMDJ)は、最低限のメタデー
タ情報のみを公開してデータ間の関係を可視化し、これを元にデータの組み合
わせ・分析案を提案し、評価し合うゲーム形式のワークショップである。その
中で得られた提案と要求を背景にデータ分析・可視化を行う手法が生まれたプ
ロセスについて、可視化手法Tangled Stringを例にとって論じる。
17:50 - 18:15 SIG-SWO-A1401-04(25分発表)
生命科学系公開データベースを対象としたクローリングワークフローの提案
○大波 純一(JST),杉崎 太一朗,牧口 大旭(MKI),宮崎 敦子,三橋 信
孝,畠中 秀樹(JST),川本 祥子(DBCLS),高木 利久(JST,東大,遺伝研)
概 要:
生命科学データベース横断検索では、主に日本国内の生命科学系分野の公開デー
タベースを網羅的に収集している。データベースを対象としたクローリングで
は、Googleでもヒットしないディープウェブの範囲を発見するための工夫や、
利用者に意味のあるデータの選定、運用側の法的判断が必要となる。本プロジェ
クトで考案されたワークフローと実施結果について紹介する。
18:15 - 18:30 SIG-SWO-A1401-05(15分発表)
RDF化したMeSHとライフサイエンス辞書を利用した生命科学概念に基づく日本
語レビュー記事の絞り込み検索
○山本 泰智(DBCLS)
概 要:
ライフサイエンス統合データベースセンター(DBCLS)ではこれまでにライフサ
イエンス辞書(LSD)をRDF化すると共にDBpediaへのリンクを日英それぞれ構築
し、リンクトデータを構築してきた。一方でDBCLSでは、NatureやScience 、
Cellなどの生命科学分野においてトップジャーナルといわれる学術誌に掲載さ
れた、日本人が著者である論文を対象として、著者本人による日本語のレビュー
記事を掲載する新着論文レビューを発行している。今般、当該レビュー記事の
文章構造を既存語彙を用いてRDF化するとともに、記事中に書かれているLSD
見出し語を機械的に抽出してリンクトデータを構築した。本データの利用例と
してMeSHツリー構造に基づく特定の語彙が多く使われる記事を検索するシス
テムを紹介する。
◇18:30 - 18:35 クロージング 細野 繁 (NEC),市瀬 龍太郎 (NII)