フォームにテキストを入力すると、そこに含まれる感情を「喜び」「好き」「悲しみ」「恐れ」「怒り」の5項目のチャートで数値化する。推奨テキスト数は10文字以上、300文字以下。 従来のテキスト感情分析では、文を単語に分解し、それぞれの意味から分析するのが一般的だった。新サービスはディープラーニングを用い、数千万件以上の口コミデータをAI(人工知能)に学習させ、文字の並び方や文末の細かなニュアンス表現から感情を読み取れるようにしたという。
今回は少し、思考を変えてシステムを開発する際にどんなところで Elasticsearch を使えるのか?という視点で説明したいと思います。 最近のシステムの特徴 最近のシステムは、ビッグデータの重要性の認知、ソーシャルデータの活用など、1つのシステムでも様々な種類のデータを管理し活用するようになってきました。また、クラウドサービスやオープンソースが当たり前に使われるようになり、データを管理し活用するためのシステムやサービスも様々な選択肢があります。 そのため、最近のシステムではデータの利用目的によってデータストアを使い分けることが多くあります。 例えば、商品情報など構造化されたデータは、ビジネス要件を満たすためにデータを矛盾なく永続化する必要があるため、MySQL などのリレーショナル・データベースに保存されます。 また、更新や参照トラフィックが多くデータ数も多いゲームやモバイルアプリケー
データ分析基盤Night #2 - connpass 2017/04/26 データ分析基盤Night #2 #データ分析基盤Night - Togetterまとめ 前回第1回に引き続き抽選に当たったのでこの日参加してきました。 『 データ分析基盤Night #1 』に参加してきた #データ分析基盤Night - 試纏 会場は株式会社FiNC様@有楽町。有楽町駅ビックカメラのすぐ隣、交通の便は超良い場所です。 会場内もとてもオシャレで綺麗なオフィスでした! 挨拶 ウェルネスタイム(軽いストレッチ) by FiNC FiNCの分析基盤の概要 発表資料 発表内容 freee のデータ分析基盤の全容 発表資料 特徴:他のサービスとどこが違うのか 構成:アーキテクチャ マーケティング 販売・サポート エンジニア ダッシュボード バッチ処理 辛み 展望・チャレンジ まとめ mercariのデータ分析基
自動制御機器、計測機器などの開発・製造を行うキーエンスが5月7日に発表した2015年3月期連結決算は、売上高が前期比26.0%増の3340億円、営業利益が同34.5%増の1757億円、純利益が同40.9%増の1211億円だった。これだけなら、なんの変哲もない高収益企業の好業績決算にすぎないが、株式市場で注目されたのが、後に触れる52.6%という売上高営業利益率の高さだった。 ファクトリー・オートメーション(FA/工場の生産工程自動化)業界担当の証券アナリストは、「先進国でも新興国でも人件費が高騰している今、どの製造業も開発・生産の省力化が不可避で、それがキーエンスの業績押し上げ要因になっている」と分析する。 FA関連大手メーカーは、いずれも業績好調に沸いているが、中でもキーエンスの業績、特に収益性は突出している。14年度の大手各社の営業利益率を見ると三菱電機が7.3%、オムロンが10.2%
Join AWS Hybrid Cloud & Edge Day to Learn How to Deploy Your Applications in the Everywhere Cloud In his keynote of AWS re:Invent 2021, Dr. Werner Vogels shared the insight of how “the everywhere cloud” is bringing AWS to new locales through AWS hardware and services and spotlighted it as one of his tech predictions for 2022 and beyond in his blog post. “What we will see in 2022, and even more […]
実の親であり会長でもある勝久氏と熾烈な主導権争いを繰り広げている大塚久美子社長が頭キレキレで鋭い中期経営計画(PDF)を発表した。 見どころをかいつまんで紹介しよう。まずは「勝久会長のせいで業績が悪化した」とぶった切る!! 久美子氏に社長を交代してからは黒字化が実現できていたのに、勝久会長に再び交代してからは大幅な赤字が出たと鋭く指摘。この一切遠慮なく指摘するあたり、実に気持ちいい。 その原因を「大塚家具の店員がまとめ買いを勧めるビジネスモデルが時代遅れになっているから」と分析。これからは単品買いを促進させるべきと主張する。 会長が推し進めようとしている完全会員制とは正反対の方向を提案。ちゃんと時代の流れを掴んでいる。 大塚家具のポジショニングはニトリ・IKEAとは違う中価格帯と再設定。奪われた顧客を取り戻すと宣言した。 大塚家具は会長の会員制路線のせいで高価格帯と認識され、ブランド力がな
タイトル通り、センサー + Raspberry Pi + fluentd + Treasure Data + 様々なプロダクトを組み合わせて、自宅が揺れる原因を分析してみるお話です♪ 長丁場になりそうなので、これから数回に分けて綴っていこうと思います。 第1回の今回は、揺れ分析をはじめた理由、やりたいこと、システム構成についてお話します。 はじめた理由 実は・・自宅マンション周辺の大規模工事が終わった頃から、毎日ふとした時に自宅が揺れています! 震度1~2くらいかな?と思ってYahoo!の地震情報を確認してみるのですが、地震は起きていません。 天井から吊してあるパネルも揺れるので、気のせいではないはずなのに。。 管理会社に問い合わせてみましたが、「よくわからないですねー」と素っ気ない返事しか返ってきません。 むむむっ、結構重要な問題だと思うんだけどー><。 揺れの原因によっては引っ越しも考
1) The document is a profile for TokyoWebmining, which is part of the Ameba Technology Laboratory at CyberAgent, Inc. It provides information about their research interests and activities. 2) Their research focuses on web mining, business intelligence, and developing new technologies like recommender systems and UI design using JavaScript. 3) One of the researchers, Kenji Matsuda, tweets at @mtknn
クラウド型のデータウェアハウス(DWH)サービス「Treasure Data Service」を手掛けるトレジャーデータは12月9日、クエリの実行速度を従来比で10~50倍に高速化するというオプションサービス「Treasure Query Accelerator」の提供を始めた。 Treasure Data Serviceは、ユーザー企業が持つ大量のセンサーデータや購買取り引きデータ、Web閲覧データ、アプリケーションログデータなどをクラウド上に蓄積し、分析可能な形に整理して提供するサービス。有償版は月額3000ドルからのサブスクリプション制で利用でき、ビッグデータ活用基盤の構築・運用にかかる時間やコストを低減するとしている。 新サービスは、アドホックデータ解析向けに新たに構築したクエリエンジンを提供し、従来のバッチ型エンジンと比べてクエリ実行速度を高速化するもの。太田一樹CTOによれば、
追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ
最近仕事がうまくいかなくて愚痴っぽくなってるはせおやさいですこんにちは。 愚痴っぽくなるのイヤですよね。でも自分の思い通りに相手が動くなんて傲慢もいいとこなので粛々と進めて行きたい。 目下の悩みは「PDCAサイクルが回せない人に、どうやってやり方を覚えてもらうか」です。 PDCAサイクルって何や PDCAサイクルっていうのは超既出だとは思うのですが一応 P 「Plan」 D 「Do」 C 「Check」 A 「Action」 の略で、「P」で計画を立て→「D」で行動・作業し→「C」でその結果を振り返り→「A」で振り返った内容を元に改善する→そして「P」に戻る…という、効果測定のテクニックというか、決めたことの精度を上げるためにやる確認の方法です。 よく見られる課題 「P」と「D」まではある程度できても、「C」が甘かったり「A」のステップをすっ飛ばして「やりっぱなし」になってたりすることって
『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day
グーグルのBigQuery、高速処理の仕組みは「カラム型データストア」と「ツリー構造」。解説文書が公開 SQLのクエリに対応し、3億件を超えるデータに対してインデックスを使わないフルスキャン検索で10秒以内に結果を出す。グーグルのBigQueryは大規模なクエリを超高速で実行する能力を提供するサービスです。その内部を解説する文書「An Inside Look at Google BigQuery」(PDF)を公開しました。 グーグルは大規模クエリを実行するサービスとして社内でコードネーム「Dremel」を構築しており、2010年にそのDremelを解説する文書「Dremel: Interactive Analysis of Web-Scale Datasets」を公開しています。BigQueryは、そのDremelを外部公開向けに実装したものです。 グーグルはこのDremel/BigQue
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く