ここは、地理データの解析、可視化、モデリングに関する書籍である Geocomputation with R のオンラインホーム (日本語版) である。 注: 本書の原著初版は CRC プレス社の R Series で出版されている。 CRC Press または Amazon で購入ができる。また、第一版 が、bookdown.org で保存されている。 本書は、Free and Open Source Software for Geospatial (FOSS4G) の活動に触発されているため、本書の基盤となるコードと解説はオープンにしてあり、内容の再現性、透明性、アクセス性を保証している。 GitHub でソースコードを公開しているため、誰でも課題 (Issue) を開いたり、新しいコンテンツや誤植の修正に貢献することでプロジェクトに関わり、みんなのために役立てることができる。 本書のオ
はじめに 超高速でreadr::read_csv()より速い Rに限らずですが、データを扱う仕事をしていると巨大なデータを読み込むことがちょいくちょくあります。 私の経験上ファイルサイズが10MBを超えてくると、どのようにファイルを読み込むか、 どのように読み込んだファイルを処理するか、気を配らないととんでもない時間のロスにつながる恐れがあると思います。 今回紹介する{vroom}パッケージは、ファイルの読み込みに特化したパッケージです。 {vroom}パッケージは正直使ったことが無かったのですが、巨大なファイルの読み込みにかかる速度を既存の方法と比較してみたところ、vroom::vroom()を使った方が極めて高速であることが分かりました。 data.table::fread()とどっちが速いかは文字列の多さ次第 結論から言うと、文字列が多いほどvroomの方が早くなります。 逆に、数値
はじめに 前回はゴリゴリのRプログラマーではない人に向けたtidyeval解説記事を書いてみました。 今回は具体的な例も交えつつ、tidyevalの理解を試みます!🧑🎓 「こんな感じに分類できそうかな?」という感じでパターン別に解説していきます。 前回同様、ほとんどの人はtidyevalの全てを理解するする必要はないし、使うところだけならそんなに理解は難しくないとという方針で進めたいと思います。 前回記事ではtidyevalで行われることのイメージを説明していますので、まだの方はそちらと併せて読んでいただけると理解しやすいと思います😃
はじめに tidyevalは「コレ」のせいで難しい R言語をそこそこ勉強してる人なら分かると思うのですが、存在は知っていても理解がめちゃくちゃ難しいのがrlangパッケージのtidyevalです。 本気でtidyevalを学びたければHadleyのAdvanced Rを読めば良いのですが、ただでさえ難解な内容が英語なので余計難しい🤯 英語が分かっても聞き慣れない単語のオンパレード。その様はまるで某WebServiceのトップページのようです。 日本語の記事を探してみると 2017年の yutannihilation さんのスライド とか、2018年の yutannihilation さんのブログポストとか、2018年の teramonagi さんのブログポストとか、2019年の uri さんのQiita記事などがあり、その節にはお世話になりました。 しかし、どれだけ日本語記事を読んでも、
このドキュメントは『指標・特徴量の設計から始めるデータ可視化学入門』で提供されているPythonによる可視化コードをR言語で書き直したものです。 ただし、Pythonのコードの直訳・逐語訳ではなくRらしい書き方・表現へ意訳しています。 以下が各章ごとのドキュメントです。 2023年2月時点で第8章まで完成。 第1章 データ可視化の本質 第2章 数量を把握するデータ可視化 第3章 メカニズムをとらえるデータ可視化 第4章 多変数をとらえるデータ可視化 第5章 データの分布をとらえる指標化 第6章 関係性をとらえる指標化 第7章 パターンをとらえる指標化 第8章 データ指標化・可視化のプロセス MATLAB版も公開されています。 以下の方針を取っています。 書籍とPythonのコードで微妙に異なる箇所は、極力書籍に合わせる。 配色の再現は目指さない。 jetカラーのグラデーションはviridi
Upcoming changes to popular R packages for spatial data: what you need to do The issue Three popular R packages for spatial data handling won’t be available on CRAN after October 2023.1 These packages are: rgdal: a package that provides bindings to the GDAL and PROJ libraries. In other words, it gives a capability of reading and writing spatial data formats, creating coordinate reference systems a
技術書典 7で購入された方のサイトはこちらです 何の本? プログラマ向けの情報を集めたA5サイズのマニュアル本です。 何回やっても毎回ググってしまう内容や、ググってもなかなか正しい情報が出ないものを中心に、約200ページ書き下しています。 どこで売っているの? 技術書典 7 で販売させて頂きました。そのときのレポート(TODO:)もご覧ください。 今後の再販は今のところ未定ですが、電子版のみであればBOOTHで手に入れることが出来ます。 どんな内容なの? 現在のバージョンの目次はこんな感じです。 間違いを見つけたんだけど / 伝えたいことがあるんだけど… twitter(@kcrt)にDM頂くか、購入された方は是非こちらのアンケートからお答えください。
概要 去年書いた話のその後の更新について整理した. おまえはもうRのグラフの日本語表示に悩まない (各OS対応) - ill-identified diary あとこっちのスライドも閲覧数が少しづつ増えてるようなので Mac でも Windows でも, PNG でも PDF でもRのグラフに好きなフォントで日本語を表示したい (2020年最終版)/Display-CJK-Font-in-Any-Gpraphic-Device-and-Platform-2020 - Speaker Deck 去年の話の直後にいろいろと大きな環境変化あった 改めて変更点と残る問題点をここでまとめる 本当は不具合を潰してから書きたかったが思ったより時間がかかりそうなので「中間報告」 以降の記述のほとんどはこれまでネット上のどこかで断片的に書いていた話で, 今回はそれらを一箇所にまとめただけ tikz について
紹介 『私たちのR』は宋財泫(SONG Jaehyun)と 矢内勇生が共同で執筆するRプログラミングの「入門書」である。統計学の本ではない。 また、本書はデータ分析の手法の解説書でもない。Rを用いたデータ分析については他の本を参照されたい。私たちが専門とする政治学におけるデータ分析については、以下の本を勧める。 浅野正彦, 矢内勇生. 2018. 『Rによる計量政治学』オーム社. 飯田健. 2013.『計量政治分析』共立出版. 今井耕介(粕谷裕子, 原田勝孝, 久保浩樹 訳)2018.『社会科学のためのデータ分析入門(上)(下)』岩波書店. 本書が想定するのは、次のような希望をもつ読者である。 分析に入るまでの段階、つまりデータの入手やクリーニング方法が知りたい 分析結果を自分の思いどおりに可視化したい 複数のモデルを効率的に分析したい Rでシミュレーションがしたい Rと友達になりたい 本
そんなあるときに、めもりーさんという方がPHPでJVMを実装しているツイートを見つけました。「これはおもしろいな」と思うと同時に「PHPでできるならRでもできるだろう」という思いがこみ上げてきて開発することにしました。 ー そんなに簡単にやってみようと思ったんですね(笑) もともとコンパイラやインタプリタは作ったことがあったので、仮想マシンも作れるかなって(笑) 私が作ったjvmrrはFizz BuzzくらいのJavaコードは実行することができるのですが、めもりーさんの資料のおかげで開発するためのハードルが低く済みました。 ー そもそもなぜRで「変なもの」を開発するようになったのでしょうか? Rって言語仕様が変わっていて本当におもしろいんですよ。それをもっとみんなに知ってほしくて言語仕様を活かしたものを作って公開するようになりました。Rってデータサイエンティストや研究者しか使わないイメージ
RStudio v1.4とraggパッケージの登場でRStudio上で日本語の作図が面倒な指定不要で行えるようになりました。記事中で紹介する方法をとれば、RStudioのPlotsパネルに出力する図が文字化けしなくなります。RStudioユーザで日本語での作図を行う方にはぜひ知っていてもらいたいtipsです。 すごい!確かにグラフィックデバイスにAGGを指定すれば、ggplot2で日本語表示する際に面倒な ggplot2::theme_*(base_family = ) をしなくても、問題なく日本語が表示される。ハッピー( ^ω^ ) https://t.co/DL1ec5wj9U— Uryu Shinya (@u_ribo) 2021年2月17日 なお、この記事の元ネタは https://www.tidyverse.org/blog/2021/02/modern-text-feature
論文のFigはほぼRで描いているのだけど、複雑なデータをコンパクトに見せるためにカラフルな図を作ることが多い。そこでいつも悩むのが「いかに効率よく配色するか」ということだ。カスタムの配色セットを作ってみたり、カラーパレットのパッケージをあれこれ試してみたりしたのだけど、自分なりに今落ち着いているのがkhromaとcirclizeという2つのパッケージなので簡単に紹介したい。 khromaはPaul Tol’s Colour Schemesに準じたカラーパレットを出力できるパッケージだ。このカラースキームの特長として、 カラーユニバーサル モノクロ印刷した際の視認性も考慮 質データ(Qualitative)、2極データ(Diverging)、連続データ(Sequential)のそれぞれに対応した複数のカラーパレットが準備されている という点が挙げられる。自分が知る限りでは、最も綿密な考慮の上
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く