Mashupノウハウ
本ページでは、Mextractr Web APIをご活用、すなわち、マッシュアップしていただく際に、ヒントとなりそうなことを記します。
サンプルソースはこちらです。
■ Mextractr を記事からのキーワード抽出エンジンとして利用
世の中には、日本語に対応した、テキストからのキーワード抽出エンジンがいくつかあります。例えば、Web API比較マッチングサイトhttp://www.api-match.com に、キーワード抽出 と入れて検索してみてください。入力テキストを限定しない、勝手に「連想」したりしないものが2,3は見つかるはずです。
Mextractrは、各キーワードに、さらに、Who, When, Where, What (event) の意味役割を付与したものを、GDATA in Atom の形式で出力します。この特徴を生かして、「誰(どの団体)が」やった出来事なのかを問い合わせられる、メタデータ検索エンジンのためのフィルタとして使うことができそうです。
■ Mextractr で事実記事の概要を把握
あるQ&Aサイト(人力検索エンジン)で、5W1Hを抜き書きすることが、話の要点を正確に把握するための良いトレーニングになることを知りました: http://d.hatena.ne.jp/nomuran7/20080708 実際、昔の出来事を詳細に長々と書いた記事が読むに耐えなかったのが、Mextractrにかけたところ、ざっとどんな事実経緯が書いてあるのか、数10分の1時間で把握できたことがあります。
Mextractrのフィード出力を事実情報に特化したサマライザ、文章要約の小窓に使えるのではないか、というご提案です。
■ Mextractrが日付、地名を数値化した結果を軸足に他のデータと連動
これには、MA4にエントリーされた方だけのために7月10日現在鋭意準備中の機能が必要です。すなわち、日付表現を正規化し、絶対年月日・時刻に変換してGDATA中に出力する機能と、登録地名の緯度・経度をgeorss要素の中に出力する機能を前提としています。 ただコンテンツを並べただけでない、賢いマッシュアップを作るための1つの鍵は、軸足メタデータの活用 にある、と考えられます。メタデータ、それも、極力自動抽出されたメタデータを用いて、複数のWebAPIの担うコンテンツを次々と連携させ、意味のある絞込みをさせてやることにより、気の利いたアプリケーションが出来やすい、と思うのです。
具体的には、地図へのマッピング、Timeline、スケジューラ、カレンダーへの自動挿入を手始めに、それらのアプリにイベント名や主催者名、開催場所を入れる作業を半自動化してみては如何でしょうか。これらのアプリがもっていたマスターデータやCGM情報から、さらなる別のサービスと連携させることもできるでしょう。
このあたり、論より証拠ですので、早急にご提供の上、試作マッシュアップの登場を期待したいと思います。
