タグ

metaDataに関するtsupoのブックマーク (39)

  • 検索3社が協力してセマンティックウェブを促進、schema.orgイニシアティブを発表 ::SEM R (#SEMR)

    検索3社が協力してセマンティックウェブを促進、schema.orgイニシアティブを発表 GoogleYahoo!Microsoft 3社が共同でセマンティックウェブを導入しやすい環境作りに取り組む。検索結果に詳細情報を反映するために必要な構造化データについて、フォーマットや形式を標準化した Schema.org イニシアティブを発足。ウェブマスターはデータ構造化を実現するための労力を減らすことが可能になり、取り組みが容易に。検索エンジンは多くのウェブサイトが提供する構造化データを使って検索サービスをもっと便利に。そして、検索ユーザーは優れた検索体験を享受する -- この循環の促進が狙いだ。 公開日時:2011年06月03日 03:27 GoogleMicrosoftYahoo!の検索大手3社は2011年6月2日、構造化データマークアップのためのスキーマ(schema.org)を共同

    検索3社が協力してセマンティックウェブを促進、schema.orgイニシアティブを発表 ::SEM R (#SEMR)
    tsupo
    tsupo 2011/06/03
    Googleはmicrodata、microformats(マイクロフォーマット)、RDFaの3つをサポートしてきたが、拡張性やシンプルさのバランスを考慮して今後はmicrodataに注力 → microformats 涙目
  • フェイスブック、ミクシィ、グリーで使われている OGP (Open Graph Protocol) とは何か - IT戦記

    みなさん、こんにちは お元気ですか?僕は元気です。 さて 最近よく、「いいね!」ボタンや「ミクシィチェック」ボタンによって、ウェブページを紹介し合う文化が少しずつ定着してきたなーと思います。 そんな中で、今後重要になってくるんじゃないかと思われる OGP (Open Graph Protocol)と言われる仕様があります。今日はそのことについて書いてみたいと思います。 OGP? おーじーぴー??とはなんでしょうか。 OGP とは 簡単に言うと「このウェブページは何のことを書いているか」という情報を、プログラムから読める形で HTML に付加する記述方法のことです。 まあ、普通のウェブページは人間が読めばだいたい何のことが書いてあるか分かりますよね。 ですが、プログラムは人間ほど頭が良くないので、そのウェブページ内の文章だけではそのページが何のことについて書かれているページなのか正確に識別す

    フェイスブック、ミクシィ、グリーで使われている OGP (Open Graph Protocol) とは何か - IT戦記
    tsupo
    tsupo 2011/01/17
    『この記事を読んで興味を持った人は、ぜひ自分のウェブページに OGP の情報を付加してみませんか?』
  • ちょっとしたメモ - セマンティック・マーク付け本ようやく脱稿

    さて、昨年夏から格闘していたセマンティック・マーク付けに関するの原稿をようやく書き上げ、出版社に送りました。仮タイトルは『セマンティックHTML/XHTML』で、毎日コミュニケーションズから5月下旬に刊行予定です。5年ほど前からの企画はありながら、なかなかまとめられずにいたのですが、昨年とあるプロジェクトが没になったのを機に、集中してこのに取り組み、何とか脱稿にこぎつけました。 セマンティック・マーク付けとは、普通のウェブ文書の中に含まれるイベントや人物などの情報を、ソフトウェア・エージェントでも扱えるように明示することで、人間が読むための文書(文書のウェブ)を、同時にコンピュータにも処理できる情報(データのウェブ)にしようという試みです。何度か取り上げたGRDDLやマイクロフォーマットもその一種ですし、最近ではRDFaという仕様がW3C勧告になり、注目を集めています。このは、そう

    tsupo
    tsupo 2009/04/06
    仮タイトルは『セマンティックHTML/XHTML』で、毎日コミュニケーションズから5月下旬に刊行予定 → 神崎さんの新刊予告。楽しみ
  • 2008年の10大セマンティック・ウェブ・サービス紹介サイトなど:『人工知能が変える仕事の未来』 野村直之(メタデータ)

    先日、1/9に品川の日立システムアンドサービスさんで開催された XMLコンソーシアム Dayで、Web 2.0部会のメンバーが、セマンティックサービスについて話してくれました。技術や規格、そして「ソーシャル」との接点の1つとして期待されるOpenSocial APIを紹介してくれたのは東芝ソリューションの西一嘉さんと、日ユニシス小林茂さん。セマンティック的なサービスの事例については、日立システムアンドサービスの湯正典さんが日のkizasi(流行る兆しの言葉をジャンル別に自動集計し紹介)と、海外のTwine(知識編集)を。IT Frontierの加藤晶子さんがレストラン検索のBooRahを。そして、ナレッジワークスの亀山悦治さんがSemanticの技術をブロガー向けに提供するZemantaを紹介してくれました。 個々の内容は、XMLコンソーシアム・サイトの掲載資料に委ねます。ここでは、

    2008年の10大セマンティック・ウェブ・サービス紹介サイトなど:『人工知能が変える仕事の未来』 野村直之(メタデータ)
    tsupo
    tsupo 2009/01/20
    10件のうちの5件を紹介 / Yahoo Search Monkey / Powerset / Open Calais / Dapper MashupAds / hakia
  • マイクロソフトなど6社が画像メタデータのガイドラインを策定

    カンファレンスではメタデータの取り扱いに関する現状が発表され、ガイドラインによってどう対処されるのかを策定していた Metadata Working Groupは24日、フォトキナ2008でカンファレンス実施。デジタル写真の検出、整理、検索に関する互換性を高めるため、Metadata Working Groupに参加するアドビシステムズ、アップル、キヤノン、マイクロソフト、ソニー、ノキアの6社が、デジタル写真のメタデータの互換性および保存に関するガイドラインを策定したと公表した。今回策定されたガイドラインは、デジタル写真(静止画)におけるコンシューマ用途にフォーカスしたもの。 具体的な活動内容やガイドラインは公表されていないが、産業界のリーダー企業がメタデータの取り扱い、互換性について足並みを揃えることで、メタデータの一貫した利用に関するルール作りや、仕様の統一などを行ないやすくなるという

    tsupo
    tsupo 2008/09/25
    今回策定されたガイドラインは、デジタル写真(静止画)におけるコンシューマ用途にフォーカスしたもの / 具体的な活動内容やガイドラインは公表されていない → せめてメタデータの仕様くらいは公表して欲しいな
  • ちょっとしたメモ - FavikiとタグとDBpedia

    先日登場した新しいブックマークサービス Faviki は、ユーザがタグを与えるときに、英語Wikipediaに登録された語句を候補として提供することで、語彙のゆれ(同義語の問題)を解消しようという特徴を持つ。さらに、タグとWikipediaの連動により、多義語の問題(Operaは歌劇かブラウザか)をも解決する可能性を示す。UIも工夫されており、タグを巡る困難へのひとつの答えともいえる。 タグの共有 以前「タグとオントロジー」で検討したように、タグを広く共有するためには、同義語、多義語の問題を処理する必要がある。アプローチとしては、 従来のタグシステムを前提として、ユーザが自由に与えたタグから、統計的な手法を利用して共通項を見出していく方法と、 ユーザがタグを与える時点で、そのタグを共有可能なもの(統制されたもの)にする方法 が考えられた。Favikiの場合は、後者の立場で、与えられるタグ

    tsupo
    tsupo 2008/06/10
    ベストとは言い難いが、タグ自身のURIにDBpediaを導入したことは大きな一歩 / 単なるフィードとしては機能するのだが、これではRDFが生きてこない、というよりも誤った情報を提供してしまう → hAtom の rel-bookmark問題と関連
  • http://japan.internet.com/busnews/20080609/13.html

    tsupo
    tsupo 2008/06/09
    グーグル株式会社は2008年6月9日、米 Google にて検索担当副社長を務め、Google 初の女性エンジニアでもある Marissa Mayer 氏を招き、グーグルの現状や今後の展望について説明 → 明日のイベントにも参加するのかな?
  • セマンティックWebコンファレンス2008

    講演資料へ  >>> 開催趣旨   セマンティックWeb技術の最新動向に関する国内外の研究者による講演、企業や研究機関におけるセマンティックWeb及びその関連技術を利用した研究プロジェクトの紹介やデモンストレーション等を行います。 また、INTAP 次世代Web委員会の活動成果としてオントロジーに関する各種報告を行います。   日  時   平成20年3月7日(金) 9:30~18:00 (受付開始 9:00) 場  所   慶應義塾大学 三田キャンパス 北館 【アクセス】 (東京都港区三田2-15-45)   主  催   慶應義塾大学 SFC研究所 財団法人 情報処理相互運用技術協会 後  援   経済産業省 財団法人 インターネット協会 社団法人 情報処理学会 社団法人 電子情報技術産業協会 定  員   240名   参 加 費   無 料   お申し込み   W

    tsupo
    tsupo 2008/02/06
    2008年3月7日 9:30〜18:00 / 慶大 三田キャンパス 北館 (去年と同じ場所) // セマンティックWeb及びその関連技術を利用した研究プロジェクトの紹介やデモンストレーション、オントロジーに関する各種報告
  • ちょっとしたメモ - SPARQLがW3C勧告に

    ウェブ上でRDFデータの照会を行うSPARQLが15日付でW3C勧告となった。仕様は、問い合わせ言語SPARQL Query Language for RDF、プロトコルSPARQL Protocol for RDF、クエリ結果のXMLフォーマットSPARQL Query Results XML Formatの3つ。バーナーズ=リーのことばを借りれば、ようやくデータベースとしてのウェブのためのSQLが標準化されたわけで、分散する多様なデータへの一貫したアクセスが可能になる。 SPARQLはすでに多くの言語で実装されていて、JavaのJenaライブラリ、PerlのRDF::Query、PHPのARC、PythonのRDFLib、さらにいろんな言語から使えるRasqal RDF Query Libraryなどが揃っている(サポート具合は差があるので、実装状況調査を参照)。 SPARQLクエリを

    tsupo
    tsupo 2008/01/22
    バーナーズ=リーのことばを借りれば、ようやくデータベースとしてのウェブのためのSQLが標準化されたわけで、分散する多様なデータへの一貫したアクセスが可能になる。
  • ちょっとしたメモ - Dublin Coreの改訂定義

    Dublin Core語彙の定義が、これまで検討されてきた内容を踏まえてかなり改訂され、新DCMI Metadata Termsとして勧告された。定義域、値域は別途Domains and Ranges for DCMI Propertiesという文書にもまとめられ、さらに改訂の概要を説明するRevisions to DCMI Metadata Termsも公開されている。 改訂概要では定義域、値域を「提案している」となっているが、語彙定義に含まれているので、正式なものと考えてよいのだろう。見やすいように「DCプロパティと定義域、値域一覧」としてまとめておく。 今回の改訂では、過去から引きずっていたいろんな経緯を振り切って、できるだけDCMI抽象モデルに忠実になるような整理が行われた。スキーム要素と呼ばれていたものが「語彙符号化スキーム」と「構文符号化スキーム」に分けて定義しなおされたり、プ

    tsupo
    tsupo 2008/01/22
    Dublin Core語彙の定義が、これまで検討されてきた内容を踏まえてかなり改訂され、新DCMI Metadata Termsとして勧告 / 定義域、値域は別途Domains and Ranges for DCMI Propertiesという文書に / Revisions to DCMI Metadata Termsも公開されている
  • 「メタデータ」が主役のコンテンツ消費・人文系が語るネット(下) インターネット-最新ニュース:IT-PLUS

    電通、三菱UFJ信託銀行など大手企業が相次ぎ参入を表明する「情報銀行」。ここに挑むベンチャー企業がDataSign(東京・渋谷)だ。同社の太田祐一社長は情報銀行という言葉が生まれる…続き 中部電力が「情報銀行」参入へ 電力データを活用 [有料会員限定] 「情報銀行」説明会に200社 データ流通の枠組み始動

    「メタデータ」が主役のコンテンツ消費・人文系が語るネット(下) インターネット-最新ニュース:IT-PLUS
    tsupo
    tsupo 2007/11/09
    コミュニティーの分断の問題 → コミュニティが細かく分断されつつも、たいていの人が複数のコミュティに属しているので、ハブになる人がいれば、コミュニティ間コミュニティのようなものができて、…… (つづく)
  • RDFとメタデータの相互運用

    (メタ)データ相互運用の課題 データモデルと名前の相互運用 どんなモデル(データ構造、スキーマ)を採用するか プロパティ(関係記述語彙)はどの程度詳細に設計すべきか、独自語彙か汎用語彙か 人物などの典拠、主題などの語彙(ノードの名前)をどうやって共有するか 記述対象をどのように識別するか(リソースの同一性) (※稿では、最初の2つ、モデルとプロパティについて検討します) 相互運用のスコープ データの共有:統合レポジトリの構築や横断検索の実現 データの交換:AのデータをBが取り込みたいとき データ相互運用とRDF/OWL なぜRDF/OWLか 柔軟性:シンプルで柔軟なグラフ構造でさまざまなモデルを表現できる 意味論:グラフの意味論が定義されており、予備知識のないデータも共通の解釈ができる 語彙の連携:語彙間の関係を記述することができ、その関係を利用した基的な推論ができる 識別と統合:UR

    tsupo
    tsupo 2007/03/09
    神崎氏による「第32回ディジタル図書館ワークショップの講演資料」 // クラスの併合とプロパティの分割
  • Mind Clip 「ニコニコ動画がYoutube嫌われた本当の理由」の補足

    前回のエントリーがはてブのホットエントリーに表示されていて凄まじいアクセスが来ている。普段、多くても100程度のアクセスしか集まらない零細ブログに何事が起きたのかと驚いたが、どうやらこちらのブログで取上げていただけたのがきっかけらしい。ありがたいことです。 実はこのブログを始めて今日がちょうど一年目になるのだが、一夜のうちに今まで集めた倍のアクセスが集まってしまった。 当は「一年間ブログ続けて良かった」というような当たり障りのない、つまらないエントリーをする予定だった。だが良い機会なので自分の妄想を差し支えない範囲で公開してみようと思う。 その前に前回のエントリーについて不充分であった点についていくつか補足していきたい。 まず、Youtubeとニコニコ動画のランニングコストのソースをについてはメディアパブさんの記事を参照いただきたい。昨年6月で一月あたりの通信コストが日円にして約1億2

    tsupo
    tsupo 2007/02/28
    ニコニコ動画は書き込んだコメントが画面にインポーズされる行為で楽しさを消費させている。また楽しむという行為がメタデータをためる消費につながるのである → メタデータをどうやって蓄積するかのヒント
  • Mind Clip ニコニコ動画がYouTubeに嫌われた本当の理由。

    このエントリーを見てはじめて知ったが http://shi3z.cocolog-nifty.com/blog/2007/02/post_02f3.html ニコニコ動画ってsinvieがベースになっていたんだね。私の中で全てがつながった気がする。 ちょうど1年位前に名古屋からsynvie開発者の山さんが上京されて直接、話を聞く機会があった。あの当時、ちょうどYouTubeがブレイクし始めており、類似の技術の売込みが多々合った状況でsynvieは非常に異色だったと思う。どの技術も動画変換の品質、UIの優秀さをアピールしていたがsynvieは違った。 動画へ突っ込みを入れる機能が訴求ポイントであり、映像の一部分にタギングできる機能もあった。映像そのものよりもテキストデータが重要であると言わんばかりのサービスだった。 これはすごいと直感した。映像にメターデータを紐付けることで検索に対する効果を

  • セマンティックWebコンファレンス2007

    「情報大航海時代の羅針盤」 経済産業省 商務情報政策局情報政策ユニット 情報経済企画調査官 兼 情報家電共通基盤政策室付企画官 八尋俊英

    tsupo
    tsupo 2007/02/19
    講演で使われた資料が公開された / PDF での公開なので、当日、実際に使われたのと完全に同じものではない(インタラクティブなところとか、デモンストレーションとか)
  • グーグルは何かを知ろうとしている: 極東ブログ

    雑記でもないのだがちょっと散漫な話になる。ので、一応結論的みたいのを先に言っておくと標題どおり「グーグルは何かを知ろうとしている」ということだ。何かとは取り敢えず人々の欲望としておく。誤解されるかなと思うのは、私がここで「グーグル」というのはシステムのことであって、その会社の経営者とか開発者という人間を指しているわけではない。 話の起点は先日のことだ。田健(著)「ユダヤ人大富豪の教え」(参照)の引用が多いあるブログのエントリについて、はてなブックマークが多数付いたことに、私は奇異な感じを持った。該当のはてなブックマークは「はてなブックマーク - ユダヤ人大富豪の教え : akiyan.com」(参照)である。はてなダイアリーでの引用を含めると四百点近いブックマークとなった。 私はこの書籍についてフィクションだと思っているしあまり関心はない。が、はてな利用者がこの書籍についてこんなに関心を

    tsupo
    tsupo 2007/02/08
    グーグルは、「本田健」というキーワードに対して、オントロジカルに結合するインターネットの情報をどのように理解(組織化)しているのだろうか / 繰り返したい。グーグルは何かを知ろうとしている
  • ちょっとしたメモ - GRDDLサポートツール2つ

    2月に入ってGRDDLをサポートするツールが2つ立て続けに登場した。一つはRaptor RDF Parser Toolkit(Dave Beckettのアナウンス)、もう一つはJena GRDDL Reader(Jeremy Carrollのアナウンス)。いずれも、XHTMLプロファイルを通したスタイルシートの間接指定ができるようになっているところが大きい。 Raptorは、C#、JavaPerlPHPRubyなどの言語から利用できるRDFパーサの高速ライブラリで、RDF/XML仕様のエディタ自らが作っている定評あるもの。GRDDLは昨年からサポートしていたが、今回スタイルシートの間接指定も処理できるようになった。手元で試してみたら、XML/RDF出力だとxml:baseがうまく出てこないものの、GRDDLの処理はきちんとできている。 JenaはJavaでRDFを処理するための定番ラ

    tsupo
    tsupo 2007/02/03
    Jena GRDDL Reader: 前処理にNekoHTMLを使って整形式でない(X)HTMLを整形式にバランスさせるオプションがあるので、世の中に氾濫しているXHTMLくずれでもGRDDLが利用できるというのもポイント
  • 評判のオントロジーとFOAF

    パネルテーマ:オントロジーの作り方、使い方 語彙を作り、語彙を使ってインスタンスを記述 ウェブにおいては、軽量オントロジーを用いて分散記述するのが主流 分散しているデータをどう結びつけるかというモデル(語彙設計)が重要 ユーザの評価とmicroformats microformats:コミュニティの合意による半構造化 ウェブログなどに記述する内容を、XHTMLのclass属性を使って半構造化する 名前空間を用いず、コミュニティ内の合意によって語彙を区別 Wikiを用いた合議スタイルによる仕様構築 利用が比較的簡単で、ウェブログ用のプラグインなどツールも多数 ユーザの評価を半構造化するhReview hReview - microformats (2005年5月ごろ0.1登場、2007年1月時点でバージョン0.3) TechnoratiのReview Searchなどで利用 XHTMLのcl

    tsupo
    tsupo 2007/01/26
    このプレゼンが行なわれたイベントの参加レポートを書きました。 http://watcher.moe-nifty.com/memo/2007/01/web2007_5cd5.html
  • セマンティックWebコンファレンス2007

    講演資料へ  >>> 開催趣旨   オントロジにより膨大なWeb上の情報を意味的に統合したり、互いに関連付けたり、色々なサイトの内容を横断的に意味検索できるようになってきました。また、暗示的な事実を抽出したり、自動処理したりする事も可能になりWebの有用性と利用時の利便性が飛躍的に向上すると期待されています。これまで、オントロジのこの様な効果は認識されていましたが、オントロジを作り、管理し、利用するのに必要な技術やツールを利用できる環境が整っていませんでした。近頃は、オントロジ関連の技術やツールも整備されて来ており、コンファレンスではオントロジを如何にして作れば良いか、また、オントロジにより何が可能になるかに焦点をあて、来るべき次世代WebであるセマンティックWebの姿を明らかにします。   日  時   平成19年1月25日(木) 10:00〜17:30 (受付開始 9:30

    tsupo
    tsupo 2006/12/27
    テーマはオントロジー。参加予定 / 平成19年1月25日(木) 10:00〜17:30 慶應義塾大学 三田キャンパス 北館
  • データの置き場は「あちら側」?「こちら側」?

    「Webを介して『あちら側』にデータや機能を置くのが今の流儀だ」「いや,『こちら側』,つまり手元の端末側にデータや機能を置くのも捨てがたい」---。梅田 望夫氏が「Web進化論」(筑摩書房発行)で分かりやすく説明して以来,「データや機能をどこに置くべきか」の議論が活発になっている気がします。様々な文書ファイル,メール,iTunes Music Storeで購入した音楽ファイル,はたまたセキュリティの鍵や,Google Browser Syncが対応した各種アプリケーションの設定パラメータのような類のデータに至るまで,その保管場所が問題となるケースは少なくありません。どこに置いたらよいのでしょう。「あちら側」でしょうか,「こちら側」でしょうか。 「こちら側」でデータを管理してきたPC歴史 ワープロ文書,表計算シート,日々のメモ書きなど,PCで作成した電子的データは伝統的に,ローカルのハード

    データの置き場は「あちら側」?「こちら側」?
    tsupo
    tsupo 2006/09/22
    ユーザーの作り出すデータを引き出し,大量に集めることが鍵 / だからこそ,大変な苦労をしてAjaxと格闘し,クロス・ブラウザ問題を解決してアプリケーションをWeb化している / 『あちら側』にデータを移動させたらこっ