[B! GPU][cache] raimon49のブックマーク

raimon49 id:raimon49

GPUとcacheに関するraimon49のブックマーク (3)

アップルの｢次世代の半導体戦略｣が見える｢M3チップ｣独特の設計とは
アップルはMacBook ProおよびiMacの新製品を発表した。これらで使われているのが、同社の新プロセッサー｢M3｣シリーズだ。アップルがMacに独自開発プロセッサを使うようになって3年が経過し、M1からM3へと世代交代している。世代を追ってプロセッサーが性能アップしていくのはマーケティング上も当然のことで、そのこと自体に驚きはない。だがよく見ると、無印・Pro・Maxという3つのバリエーションも、実は細部を見ると過去とは少し変わった状況がある。取材のなかから見えてきたのは、アップルの新しい半導体戦略だ。
raimon49 2023/11/02
Apple

CPU

GPU

Mac

cache

design

memory

performance
リンク
CPUとGPUのマルチスレッディングの違いについて - arutema47's blog
"Locality is efficiency, Efficiency is power, Power is performance, Performance is King", Bill Dally マルチスレッディングとは？ CPUとGPUのマルチスレッディングの違いをブログにまとめていたけど例によって誰も興味なさそう— arutema47 (@arutema47) 2021年8月16日つぶやいたら読みたい方が多そうだったので完成させました。マルチスレッディングとはメモリ遅延を隠蔽しスループットを上げるハードウェアのテクニックです。ただCPUとGPUで使われ方がかなり異なるため、その違いについて考えてみる記事です。（SIMDについて並列プログラミングの観点から触れるべきでしたが、時間無いマルチスレッディングに注目するため初版では省きました。）本記事について本記事はCPUとG
raimon49 2021/08/27
CPU

GPU

PC

Thread

cache

design

memory

performance

study

x86
リンク
CPU とキャッシュのはなし - graphics.hatenablog.com
別にグラフィックスに限ったことじゃないし、そもそも論文とか全然関係ないけど。GPU 周りでもたまに話題になるし、自分でもたまにわけわからんくなるから整理しとく。メインメモリは遅い CPU からメインメモリにデータを読みに行く場合、これはとにかく遅い。例えばレジスタにあるデータを読みに行く場合と比べると、だいたい数倍から数100倍の遅さ。ヤバいからなんとかしよう。もっと早くアクセスできる場所にデータおいとこう。キャッシュライン CPU がメインメモリからデータを読み出すとき、必ず小さなメモリチャンクをキャッシュ上にロードする。ロード単位はプロセッサによるけど、だいたい 8 ～ 512 バイト。このロード単位をキャッシュラインと呼ぶ。アクセス対象のデータが既にキャッシュに載ってる場合は、メインメモリじゃなくてキャッシュを読みに行く。ない場合はメインメモリにアクセスするけど、そのデータはも
raimon49 2012/05/04
CPU

GPU

cache

programming

study
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx