タグ

日本語に関するtsupoのブックマーク (37)

  • もう既に海外のアニメオタクが日本語と英語の混成語を駆使しているのであった。

    皆の衆 @minano_shu 外人のアニメオタク、「What!?」のノリで「Nani!?」を使って「Nani the fuck」とか言い始めた上に「shinidie(死にダイ)」とか「yamekudastop(やめくだストップ)」とか日語と英語の混成語作りまくってんの面白すぎるだろ pic.twitter.com/ioXen8KX05 2019-05-15 15:21:53

    もう既に海外のアニメオタクが日本語と英語の混成語を駆使しているのであった。
    tsupo
    tsupo 2019/05/16
    これは興味深い
  • 国語世論調査:慣用句の理解度 「確信犯」わずか17% | 毎日新聞

    文化庁が21日発表した2015年度「国語に関する世論調査」では、慣用句の理解度についても調べた。「確信犯」という言葉は来、「政治や宗教などの信念に基づいて正しいと信じてなされる行為や犯罪、またはその行為をする人」という意味だが、正しく理解している人は17.0%。「悪いことであると分かっていながらなさ…

    国語世論調査:慣用句の理解度 「確信犯」わずか17% | 毎日新聞
    tsupo
    tsupo 2016/09/22
    石橋をたたいて割る
  • 「障害」書き換え説,あるいは戦前の雑さ - アスペ日記

    いつごろから広まったのか知りませんが、“「障害」は来「障碍」と書くのに、戦後になって「障害」と書くようになった”という俗説があります。 結論から書きます。 「障害」は戦前からある書き方です。 今はGoogle ブックスという便利なものがあるので、画像を貼っておきます。 法律年鑑 第十三巻(昭和十二年) 別表ニ掲グル身體障害二以上存スルトキハ重キ身體障害ノ該當スル等級ニ依リ障害扶助料ヲ支給スベシ 百聞は一見にしかず、ですよね。 この話はここでおしまいです。 …なのですが、どうしてこの手の俗説が絶えないのか、少し考えてみます。 この考え方の背景には、「社会は間違っている、自分は正しいことを知っている」という中二病的心理があるように思います。 典型的なのが、コラムニストの小田嶋隆さんに絡んでいる次のツイートのようなものです。 @tako_ashi 障がい者を障害者となぜ書くのかというと 来は

    「障害」書き換え説,あるいは戦前の雑さ - アスペ日記
    tsupo
    tsupo 2014/01/13
    『「障害」は戦前からある書き方です。』
  • 「4歳になる娘」は3歳なのか?

    澤村 圭一 @onarapooh 今日やった英作文の問題。「うちの4才になる娘は人見知りがきつくて…」 驚いたことにこの娘の年齢を生徒の大半が「3才」と捉えていた。「4才だよな?」とバイトの東大生に聞いたら、「3才だと思います。先生の言い分もわかりますが」と言われた。言い分てw 日語詳しい方、解説ぷりーず! 2013-11-18 23:38:53

    「4歳になる娘」は3歳なのか?
  • 「訊く」補足 - アスペ日記

    前回の記事の簡易版、兼補足、兼回答です*1。 まず、タイトルから「『訊く』って間違ってるの?」と思った人に。 あれはインパクト重視でつけた短いタイトルなので、誤解があったら申し訳ありません。 文に書いた通り、「『聞く』と『訊く』は使い分けるのが正しい」というのが誤解ということです。 それから、「結局何が正しいの?」となった人に。 漢字の訓読みに正解はありません*2。 あるのは、「どれだけの人が*3どう使ってきたか」だけです。そういう意味では、"ask" の「きく」を表すのにはこれまで「聞く」「訊く」ともに使われていて、今までの主流は「聞く」です。 「訊く」を使う理由はいくつかあると思いますが、それぞれについて。 「『訊く』のほうが正しいから」: そんな根拠はありません。 「『訊く』のほうがいいから」: どういう意味で? ということで、詳しくは前回の記事を読んでみてください。 「『訊く』の

    「訊く」補足 - アスペ日記
  • なぜ広まった? 「『訊く』が正しい」という迷信 - アスペ日記

    タイトルはパクリ。 二つの疑問 タイトルを読んだ人の反応は、主に次の二つに分かれる*1だろう。 「訊く」が正しいなんて思っている人がいるの? 「たずねる」という意味では「訊く」が正しいんじゃないの? まず、「訊く」が正しいなんて思っている人がいるの? という人に対して。 当にいる。 Yahoo! 知恵袋の質問から引用。 聞く・聴く・訊く・・・「きく」の使い分けについて 噂を聞く (中略) 道を訊く 上記例で使用例は合っているでしょうか? 訊 字は、たづねるの訓があり、訊問(じんもん)という言葉もありますから、人に問うの意味で使うと考えて良いでしょう。 (中略) 質問者さんの挙げた例は、正しく使い分けられています。 こういう人は実際に「訊く」が正しいと思っているということだ。 そして、「訊く」が正しいんじゃないの? という人に対して。 小説から少し引用する。 まず、「坊っちゃん」の冒頭部分

    なぜ広まった? 「『訊く』が正しい」という迷信 - アスペ日記
  • 「日本語はあいまい」違う、神戸で「活字文化公開講座」 : ニュース : 関西発 : YOMIURI ONLINE(読売新聞)

    読売新聞社が進める21世紀活字文化プロジェクトの一環である「活字文化公開講座」(活字文化推進会議、神戸松蔭女子学院大主催)が17日、神戸市灘区の神戸松蔭女子学院大で開かれ、約300人が参加した。 東京大教授のロバート・キャンベルさんが「世界に語りかける日人の力」と題して基調講演=写真=。若山牧水の短歌などを英訳する活動にふれ、「英語は合理的で日語はあいまいと言われるが、それは違う。日語は言葉のイメージを多彩に膨らますことができ、包容力のある言語だ」と語った。 この後、神戸市立須磨翔風高校教諭の藤井稚津子さん、神戸松蔭女子学院大准教授の山内啓子さんを交え、読書を通じて若者のコミュニケーション能力をいかに高めるかを話し合った。

    tsupo
    tsupo 2010/07/21
    「英語は合理的で日本語はあいまいと言われるが、それは違う。日本語は言葉のイメージを多彩に膨らますことができ、包容力のある言語だ」
  • Baidu Japan(バイドゥ株式会社)

    このページをブックマーク登録されていた方は、 お手数ですがブックマークの変更をお願いいたします。 なお、このページは5秒後に自動的にジャンプします。 自動的にジャンプしない場合は、下記のリンクをクリックして下さい。

    tsupo
    tsupo 2010/06/22
    検索エンジンを提供するBaiduでは、ウェブ上で使われているネットスラングなど、不自然な言語の処理に取り組むコンテストを開催します / 2010年7月20日(火)正午: 作品応募締切
  • 不自然言語処理コンテストのコーパスで乱数作文 - 木曜不足

    Baidu さんの不自然言語処理コンテスト( http://www.baidu.jp/unlp/ )が始まったそうで。 5-gram までのコーパスも配布ということでとりあえず応募するしないはおいといてダウンロードダウンロード……。 2-gram でマルコフ連鎖で文章生成って誰でも考えるよなあ。サンプルスクリプトもあるし、早い者勝ちだよなあ。 というわけでさっくり書いてみた。サンプルスクリプトをちょこちょこっと削って、ちょこちょこっと足しただけ。numpy 使ってます。 import sys, codecs, numpy sys.stdout = codecs.getwriter('utf_8')(sys.stdout) if len(sys.argv) != 2: print >>sys.stderr, "Usage: randomtext.py <2gm file>" exit(1)

    不自然言語処理コンテストのコーパスで乱数作文 - 木曜不足
  • 思いどおりの日本語入力 - Google 日本語入力

    メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

    思いどおりの日本語入力 - Google 日本語入力
    tsupo
    tsupo 2009/12/03
    Google 日本語入力は、ソフトウェアエンジニアの工藤と小松の 20% プロジェクトからスタート / 自然言語処理や各種プラットフォームの開発経験者たちのノウハウが凝縮されたものとなっています
  • 英語話者に対する言語習得難易度表:日本語は最高難度 - A Successful Failure

    少なからぬ日人が日語は難しい言語だと信じているようだ(日刊スレッドガイド : 日人はなぜ日語は世界一難しい言語と信じているのか?)。 言語の習得難易度は学ぶ対象とする言語と母語(第一言語)と間のあらゆる言語学的関係、および個々人の資質や学習環境に大きく作用されるため、一概に議論することはできない。学習者の生活する文化的背景、接触してきた言語(第二言語、etc.)によっても習得難易度は変わるため、世界中の人々に普遍的な世界一難しい言語というものは存在しない。ただ、英語を母語とする者にとっては、日語は最も習得が難しい言語のひとつであることは確かなようだ。 外交官などの専門職を養成する米国務省機関である外務職員局(FSI: Foreign Service Institute)が英語を母語とする者が習得するのにかかる期間を元に各言語の習得難易度をまとめている(Language Learn

    英語話者に対する言語習得難易度表:日本語は最高難度 - A Successful Failure
    tsupo
    tsupo 2009/09/21
    英語を母語とする者にとっては、日本語は最も習得が難しい言語のひとつ / 最難度の言語でも真剣に88週、2年間も勉強すれば不自由しないレベルまで習得することが可能であることを示している
  • 「ふいんき」よりも気になる「定員さん」:ekken

    雰囲気を「ふいんき」と入力して‘なぜか変換できない’とネタ扱いするのが有名なんだけど。 「店員さん」を「ていいんさん」と入力して「定員さん」の表記になっているのをネタにされているのを見たことがないなぁ。それとも僕が読んだことがないだけで、この手の誤字指摘マニュアルなんかでは定番ネタになっているんだろうか。 ひらがな(=表音文字)のまま表示されている「ふいんき」と異なり、漢字表記(=表意文字)の「定員」の違和感は大きい。 「てんいん」が「定員」と誤変換されることはありえないし、「tennin」「tenninn」が「tenin」とタイプミスすることはあっても「teiin」と入力することは考えにくいので、‘お店の人’を「定員さん」と思い込んでいる人が少なくないのかもしれない。 ちなみにATOKでは「ふいんき」→「雰囲気」、「ていいん」→「店員」に(誤入力であることの注意と共に)変換される模様。

    tsupo
    tsupo 2008/09/20
    ATOKでは「ふいんき」→「雰囲気」、「ていいん」→「店員」に(誤入力であることの注意と共に)変換される → 変換されちゃったら、「なぜか変換できない」ネタにならないよ! ATOKのいけず // 「週刊」を「週間」とか多
  • 解消:日本語の文字化け障害について

    15日朝、文字化けが解消しました。 原因について、下記の通りご報告します。 FIreFoxの言語設定が日語の場合、Firefoxが送信するHTTPプロトコルヘッダは、 "HTTP_ACCEPT_CHARSET" => "EUC-KR,utf-8;q=0.7,*;q=0.7" となっており、EUC-KRが優先、utf-8が2番目となっていた。 EUC-KRを指定しているため、Twitterの言語変換判定において文字コードがShift-JISが優先され、画面にShift-JISの文字コードを出力してしまう。しかしながら、Twitterがブラウザに送信しているHTTPヘッダーやメタタグの文字コードはUTF8となっているため、文字コードのミスマッチが発生してしまった。 また、一部の文字が正しく表示された理由については、その部分が言語変換判定を用いず、直接出力される部分であったためである。 対策と

    解消:日本語の文字化け障害について
    tsupo
    tsupo 2008/05/15
    FIreFoxの言語設定が日本語の場合、HTTPプロトコルヘッダは、"HTTP_ACCEPT_CHARSET" => "EUC-KR,utf-8;q=0.7,*;q=0.7"となっており、EUC-KRが優先、utf-8が2番目 → え゛っ? EUC-JPじゃなくてEUC-KRなの?
  • Twitter日本語版記者説明会

    Twitter語版の公開について、デジタルガレージ社内にて記者説明会を行いました。会場には各報道・出版社より14名の参加をいただきました。また、Ustreamによるライブ動画での中継を行いました。 会場で使用しました、Twitterの共同創業者であるエバン・ウイリアムズとビズ・ストーンと、デジタルガレージ共同創業者の伊藤 穰一のコメント動画をご覧ください。 【Evan&Biz 】 【Joi Ito 】 また、Ustreamでは、最大170余名の参加をいただきました。下にIRCのログを公開してます。 06:48 gorimaru9 : 音が出てないね。 06:50 gorimaru9 : 音出てる? 06:50 kagamiriel : 出ないですね 06:53 llcheesell : 音聞こえた 06:53 gorimaru9 : 聞こえます~ 06:53 kuroreva : 小さ

    tsupo
    tsupo 2008/04/23
    ustream(付属の IRC)のチャットログが載ってる! / 参加したかったなぁ
  • 「Twitter」日本語版公開、日本独自で広告配信も

    Windows SQL Server 2005サポート終了の4月12日が迫る、報告済み脆弱性の深刻度も高く、早急な移行を

    tsupo
    tsupo 2008/04/23
    言語選択メニューから切り替えることも可能 / 日本語版はPCサイトのみで、携帯電話向けサイトは準備中。「近い将来対応する予定」
  • エノエノモエジィールとは - はてなキーワード

    このキーワードはまだ作成されていません。

    tsupo
    tsupo 2007/11/16
    「へのへのもへじ」がフランス語に入り込んでるんだ
  • Passion For The Future: 日本語の源流を求めて

    語の源流を求めて スポンサード リンク ・日語の源流を求めて 日語タミル語起源説の大野晋が研究の集大成を一般人向けに平易にまとめた新書。 「北九州の縄文人はタミルから到来した水田耕作・鉄・機織の三大文明に直面し、それを受け入れると共に、タミル語の単語と文法とを学びとっていった。その結果、タミル語と対応する単語を多く含むヤマトコトバが生じたのである。」 日語とタミル語は文法も単語も共通点が非常に多い。物の名前が同じというだけならば、そういうこともあるかなというレベルなのだが、「やさしい」「たのしい」「かわいい」「にこにこ」「やさしい」「さびしい」「かなしい」などの感情を表す言葉までほぼ同じなのである。 さらには日的情緒の代表格「あはれ」までタミル語に同義でみつかるのだ。五七五七七の韻律を持つ詩もタミル語にある。日固有と感じられるものが実は南インドからの伝来のものであったというの

    tsupo
    tsupo 2007/11/07
    日本語タミル語起源説の大野晋が研究の集大成を一般人向けに平易にまとめた新書 / 五七五七七の韻律を持つ詩もタミル語に / 注連縄や門松まである / 偶然ここまで単語や文法、背景の文化が一致するとは考えにくい
  • gooランキング - あらゆるものをランキングで紹介!ランキングの総合サイト

    gooランキングの情報をお届けします。 プッシュ通知を受け取りたい方は「プッシュ通知を受け取る」を押して頂き、 さらに後から表示されるポップアップの「許可」を押してください。

    gooランキング - あらゆるものをランキングで紹介!ランキングの総合サイト
    tsupo
    tsupo 2007/10/03
    そういえば、これから横道に反れることを宣言するのに「閑話休題」を使ってる人がいるなぁ。「煮詰まる」は主語次第で意味が変わる気がする。
  • 辞書不要の形態素解析エンジン「マリモ」とは − @IT

    2007/08/15 検索サービスを提供するベンチャー企業のムーターは8月1日、辞書を必要としない形態素解析エンジン「マリモ」の提供を開始した。従来、形態素解析では品詞情報を含む日語辞書を用意するのが常識だったが、マリモでは、そうした辞書を不要とした。新技術のアプローチと特性について、開発元のムーターに話を聞いた。 統計処理で単語部分を推定 形態素解析とは、与えられた文を、文法上意味のある最小の単位(形態素)に区切る処理。「今日は晴れています」なら、「今日(名詞)/は(助詞)/晴れ(動詞)/て(助詞)/い(助詞)/ます(助動詞)」と分ける。検索エンジンをはじめ、さまざまな自然言語処理の場面で必要となる基礎技術だ。 形態素解析を行うには、あらかじめ品詞情報が付加された数十万語からなる辞書を用意する必要がある。また、新語や造語、専門用語に対応するには、個別に人力で単語を登録する必要がある。

    tsupo
    tsupo 2007/08/16
    「マリモ」と聞いて、人工無脳の「まりも」たんを連想してしまう。 // マリモは、あらかじめ動詞や形容詞の活用形についての知識を持たず、頻度情報と位置情報を使った統計処理だけで、どの音のつながりが単語で、そ
  • けだるい午後、しないべき - finalventの日記

    スタバでぼーっとしてたら女子高校生? 女子大生? わきゃー娘の区別が付かないが、しゃべっているなかに、 するべきか、しないべきか っつうのがあって、え゛それって日語とかおじさん思っちゃいましたよ。 「しないべき」っていう日語アリ? っていうか、もろに、それってワタシ的には文法エラーなんすけど。 ぐぐったら⇒しないべきか - Google 検索 うひゃあ、これって、すでに、日語だよ。 俺っちだったら、なんて言うだろ、そのシチューション。 「するべきか、やめるべきか」(これがフツーか) 「するべきか、せざるべきか」(これりゃ古すぎ) 「するべきか、するのやめとくか」(俺っぽいぞ) 「するべきか、しないでおくか」(おセックスとか……) 「するべきか、しないほうがいいか」(これも俺っぽい) うーむ。 ちょっとやな悪寒してぐぐると。 うっひゃぁ⇒べないべきか - Google 検索 こりゃ、

    けだるい午後、しないべき - finalventの日記
    tsupo
    tsupo 2007/05/10
    いや、「するべき」というのがそもそも変で、「すべき」と書くべきwwwww