タグ

ベンチマークに関するvccのブックマーク (154)

  • ARMはx86より効率がいいというのは過去の神話

    従来から、「ARMはx86より(電力的に)効率的だ」という言説があります。これは単純に「ARMは省電力なスマホ向けで、x86は電力をPC向け」程度のアバウトなイメージのこともありますし、前世紀のRISC vs CISC論争のころからある「ARMはx86 (x64を含む)に比べ命令セットがシンプルなので、命令デコードにかかる電力が少なくて済んで効率的」という議論の形をとることもあります。 この議論については、半導体エンジニアの多くは「ARMがx86 より効率が良いというのは、もはや過去の神話」(in today’s age it is a very dead argument)という認識を共有していると言っていいでしょう。有名なところではApple CPU (ARM)とZen (x86)の両方を開発したジム・ケラー氏のインタビューでも言われていますし、Chips and Cheeseとい

    ARMはx86より効率がいいというのは過去の神話
  • 第801回 続・USBメモリ型SSD選手権!長時間の書き込みにも強いデバイスはどれだ | gihyo.jp

    第三種目 限界突破8GB走(書き込み部門) 第一種目の8GB走(シーケンシャル書き込み部門)では、NVMe SSDUSBメモリSSDの間であまり差がつかず、360MB/sあたりに限界があるように見受けられました(図2、図3⁠)⁠。 図2 USBメモリSSDは、従来型USBメモリ(茶色の線)に比べて8GBの書き込みに必要な時間(横軸)が格段に短かかった 図3 しかし、NVMe SSDUSBメモリSSDの間では最高速度(縦軸)の面であまり差はつかず、360MB/s付近に天井があるように見受けられた そこで第三種目では限界の突破を試みます。速度の壁はSSD自体の性能に起因するものではなく、テストに使用していたUSBポートが5Gbpsまでにしか対応していないことが原因と考えられます。 特にノートPCにおいては、USB Type-CポートとType-Aポートの両方が搭載されている場合に、T

    第801回 続・USBメモリ型SSD選手権!長時間の書き込みにも強いデバイスはどれだ | gihyo.jp
  • FirefoxがついにChromeよりも高速なブラウザに

    Treeherderは、Mozillaの開発するソフトウェアのテスト結果や、ウェブサービスや外部ツールで取り込んだデータを抽出・加工するETL機能などを有するウェブサイトです。このTreeherderに、Google ChromeとFirefoxのベンチマークテスト結果をまとめたデータが公開されました。これによると、FirefoxはChromeよりも高いスコアを出している、つまりは高速なブラウジングが可能なブラウザということのようです。 Perfherder https://treeherder.mozilla.org/perfherder/graphs?timerange=31536000&series=mozilla-central,3735773,1,13&series=mozilla-central,3412459,1,13 Firefox has surpassed Chrome

    FirefoxがついにChromeよりも高速なブラウザに
  • CPU シミュレータを用いて継続的ベンチマークを安定化させる - mizdra's blog

    id:mizdra は eslint-interactive というツールをメンテナンスしています。このツールを使うと、多数の ESLint エラーを効率的に修正できます (詳しくは以前書いた記事を見てください)。 www.mizdra.net eslint-interactive では「中規模〜大規模なコードベースであってもキビキビ動く」を大事にしてます。その一環として、eslint-interactive には CI (GitHub Actions) でベンチマークを取り、以前から大きく劣化していたら CI を fail させる仕組みがあります。 https://github.com/mizdra/eslint-interactive/actions/workflows/benchmark.yml?query=is%3Afailure しかし CI で実行するためにノイズが大きく、よく

    CPU シミュレータを用いて継続的ベンチマークを安定化させる - mizdra's blog
    vcc
    vcc 2023/02/14
    ノイズがある環境で安定的にベンチマークを取るにはCPU 命令数とCPU キャッシュヒット率を見れば良い
  • QUICの実装はTCP並みの効率を実現できるか? Fastly奥氏らがベンチマークを紹介

    現在標準化が進められている次世代HTTPの「HTTP/3」は、トランスポートプロトコルとして「QUIC」と呼ばれる新しいプロトコルを採用します。 現時点のHTTPはトランスポートプロトコルとして「TCP」が採用されています。その上で、可能な限り高速な通信が行えるようにさまざまな工夫や最適化が進められてきました。そしてもうこれ以上高速にしようとすると、TCPそのものを改善していくべきだろう、というところまできたのです。 それがHTTP/3で「QUIC」が採用される大きな理由といわれています。 TCPは内部で輻輳制御や再送などを自動的に行うことで通信が確実に行われることを保証してくれる便利なプロトコルですが、それゆえに、確実に通信が行われるまで待つ必要があるために通信環境によっては遅くなりがち、などの側面があります。 そこでQUICは、TCPのような通信の保証がない代わりにリアルタイム性の高い

    QUICの実装はTCP並みの効率を実現できるか? Fastly奥氏らがベンチマークを紹介
  • 40GFlops/Wに迫る高電力効率を出したPFNのMN-3スパコン - SC21

    2021年11月のGreen500で、39.38GFlops/Wというスコアを出し、プリファードネットワークス(Preferred Networks:PFN)は業界を驚かせた。 次の表はGreen500の上位10システムをリストしたもので、1位はPFNのMN-3スパコンで電力効率は39.38GFlops/Wである。そして、2位はSamsungのSSC-21 Scalable Moduleで33.98GFlops/Wである。2位以下のシステムが2.5GFlops/W未満の僅差で並んでいるところで、1位と2位がその2倍の5.0GFlops/Wの差は驚異的である。 PFNのMN-3スパコン (出典:PFN資料) また、MN-3は前回のGreen500の時と同じハードウェアでありながら、ソフトウェアだけの改善で29.7GFlops/Wから39.38GFlops/Wまでエネルギー効率を改善したのも驚

    40GFlops/Wに迫る高電力効率を出したPFNのMN-3スパコン - SC21
  • コンバーチブル:屋根が開く速さのトップ12

    オープンカーのルーフ開閉の速さの最速12台は? オープンカーのルーフを、何秒で開閉することが出来るのかの最速トップ12位が掲載されていたので、見てみました。 こちら、手動での開閉ではなく、あくまでも「自動開閉」(ボタンを押したら屋根が開閉するタイプ)での速度順位です。 手動の場合だと、扱う人の器用さと、筋力とかでも開閉時間は変わってきちゃいますからね(笑)。 ではでは、見てみたいと思います。まずは12位から。【 】内がルーフトップオープンにかかる時間です。 12位: BMW i8ロードスター 【15秒】 時速50㎞までなら走行時に操作可能。

    コンバーチブル:屋根が開く速さのトップ12
  • いま知っておきたいLinux─WebアプリがOSのプロセスとしてどのように見えるか? を運用に生かす|ハイクラス転職・求人情報サイト AMBI(アンビ)

    いま知っておきたいLinux─WebアプリがOSのプロセスとしてどのように見えるか? を運用に生かす Webアプリを動かして負荷をかけると、OSのプロセスという観点ではどのように見えるのでしょう? それを通して運用やトラブルシューティングではどういったことが分かるのでしょう? Linuxカーネルの開発者でもある武内覚(sat)さんによる解説です。 こんにちは、sat(@satoru_takeuchi)と申します。 コンピュータが誕生してから現在まで、最終的にエンドユーザが意識するアプリケーション開発はどんどん楽になっています。先人たちのたゆまぬ努力の結果、アプリ開発者はOSや、そのさらに下にあるハードウェアのことをほとんど意識することなく開発ができるようになりました。 しかし、「作ったアプリが、OSレベルでどのように動いているか?」が今一つピンと来なくて、モヤモヤしていないでしょうか。それ

    いま知っておきたいLinux─WebアプリがOSのプロセスとしてどのように見えるか? を運用に生かす|ハイクラス転職・求人情報サイト AMBI(アンビ)
  • 「Rust」言語はCよりも遅いのか、研究者がベンチマーク結果を解説

    「C」や「C++」に代わるシステムプログラミング言語として「Rust」が注目を集めている。メモリ安全性が高く、メモリ破壊バグといった脆弱(ぜいじゃく)性を作り込みにくいからだ(関連記事)。 ただし、システムプログラミング言語では、高い処理性能が必須条件であり、これがCやC++が使われ続けている理由となっている。Rustはどの程度「速い」のだろうか。 ドイツのミュンヘン工科大学で博士課程の学生であるポール・エメリク氏は2019年9月9日、Rustで作成したデバイスドライバの性能評価をGitHubで発表した。 同氏のグループはさまざまな言語で同じ機能を備えたデバイスドライバを記述し、性能を比較している。 何が性能低下を引き起こしているのか 性能評価用に作成したのは、Intelのイーサネットコントローラー向けのLinux用デバイスドライバだ(ixgbeタイプ)。 エメリク氏は解説の冒頭で研究に取

    「Rust」言語はCよりも遅いのか、研究者がベンチマーク結果を解説
    vcc
    vcc 2019/09/14
    “境界チェックが、Rustのパフォーマンス上の主なデメリットとなっている”
  • 2018年にリリースされたビットコインASICのうち利益が出るのは5機種のみ

    2018年は仮想通貨市場全体が下落傾向にあった事もあり、より高いハッシュパワーを少ない電力で得る事ができる高性能なマイニングリグへの需要が高まりました。 しかし、そんな努力を尻目に下落し続けるビットコインによって、その多くは利益を出せない状況に陥っています。さらに驚きなのが、今年リリースされたマイニングリグのうちの多くがいまだに発送すらされていないという点です。 利益を出す事ができる5つのマイニングリグ2018年はSHA-256アルゴリズムを採用しているBitcoin Cash(BCH)、Bitcoin(BTC)、Peercoin(PPC)などの通貨がその価値の大半を失いました。その影響により、今年リリースされたばかりのマイニングリグの多くは利益を生み出せない状況になっており、いくつかの機種は現在購入すらできないと報じられています。 Asicminervalue.comのリアルタイム統計に

    2018年にリリースされたビットコインASICのうち利益が出るのは5機種のみ
  • WSL1とWSL2のベンチマーク公開 、どっちの性能が高い?

    Phoronixは6月14日(米国時間)、「Linux Hardware Reviews, Articles, & Gaming - Phoronix」において、WindowsLinuxバイナリを実行する技術であるWSL1とWSL2のベンチマーク結果を発表した。 WSL1はWindows 10にすでに搭載されている機能、WSL2Windows 10の開発版に搭載されている機能だ。MicrosoftWSL2でファイルシステムパフォーマンスが大幅に向上するとうたっており、ユーザーや開発者から注目されている。 Phoronixのベンチマーク結果は多岐にわたるが、大きくまとめると次のような結果になっている。 I/Oバウンダリな処理に関しては、WSL2がWSL1よりも高い性能を示している CPUバウンダリな処理に関しては、WSL1がWSL2よりも高い性能を示している I/OバウンダリはWSL2

    WSL1とWSL2のベンチマーク公開 、どっちの性能が高い?
    vcc
    vcc 2019/06/21
    “I/Oバウンダリな処理に関しては、WSL2がWSL1よりも高い性能を示している CPUバウンダリな処理に関しては、WSL1がWSL2よりも高い性能を示している”
  • 使われないアプリを作らない方法 - AppBrew Tech Blog

    遊撃エンジニアの @anoworl です。普段はバックエンドやインフラの開発を中心に、ライブ動画配信の仕組みをAWS MediaLiveで構築したり年末年初のCM放映に伴う負荷対策をしたり…今は採用や2B向けのSaaSも開発しています。CMに出演したローラさんがオフィスに来たのは良い思い出です。 だんだんと社員が増えて会社っぽくなってきた弊社では採用活動に力を入れているのですが、その中でお話するとウケが良かった話をここでは紹介したいと思います。 それは弊社のミッションである「ユーザが熱狂するプロダクトを再現性をもって創造する」に直結する、チームの文化です。 そこでこの記事では「使われないアプリを作らない」ために私達が愚直にやっている方法を記します。 アプリを作ると一口に言っても「新規に作る場合」「既存のものを改善していく場合」がありますが、ここでは後者「既存のアプリを改善する場合」に焦点を

    使われないアプリを作らない方法 - AppBrew Tech Blog
  • 【後藤弘茂のWeekly海外ニュース】 マルチダイ化へ向かうNVIDIAのリサーチチップ「RC 18」

    【後藤弘茂のWeekly海外ニュース】 マルチダイ化へ向かうNVIDIAのリサーチチップ「RC 18」
    vcc
    vcc 2019/04/08
    RISC-V命令セットアーキテクチャの「Rocket」コアだ。Rocketコアはシンプルなシングルイシュー/5ステージのCPUコアだ。ArmのCortex-A5クラスのコアよりも実装面積が小さく、効率がよい。
  • 月数100万アクセスをDB使わず超簡単にさばく - Qiita

    初Qiitaな個人開発者のひさしAppと申します @Hisashi_vc 最近「じぶんコイン」というコイン系SNSサービスを作り、月間100万~数百万アクセスを激安サーバー(1000円ちょい)でさばき中です。 じぶんコイン https://crypto-app.tokyo/qCoin/?m=hisashi_vc おまけになかなかの高負荷で、3ヶ月で数百万回送金したり、10連ガチャ回しまくったり、全ユーザーページにチャットあったり、数百人に一斉メッセージ&送金したり、さらに内部API叩きまくってたりと、かなりのヤバさですが、ブロックチェーンどころかデータベース一切使ってません。 そんなツイートしたら予想よりビックリしてもらえたので、種明かししようと思います。ちなみに私はサーバーサイドエンジニアでも何でもないので、Hellow world覚えて3日目の中学生でもできるくら超簡単ですw この2つ

    月数100万アクセスをDB使わず超簡単にさばく - Qiita
  • Linuxバイナリを最適化して性能を向上させる「BOLT」、Facebookがオープンソースで公開。言語やコンパイラに依存せず高速化

    Linuxバイナリを最適化して性能を向上させる「BOLT」、Facebookがオープンソースで公開。言語やコンパイラに依存せず高速化 Facebookは、Linuxバイナリの内部配置を最適化することによりCPUのキャッシュ効率などを向上させ、実行速度を改善する「BOLT」をオープンソースで公開しました。 BOLTは「Binary optimization and layout tool」の略とされています(もしかしたら、より速く走るという意味でウサイン・ボルト氏にかけているのかもしれません)。 BOLTは言語やコンパイラに依存せず、ソースコードも不要 BOLTのおもな効果は、Linuxバイナリの実行状況をperfコマンドで取得し、高頻度で実行されている部分などを判別した上で、そうした部分がCPUキャッシュにヒットしやすいようにバイナリの内部配置を改善することなどで実行速度を向上させることと

    Linuxバイナリを最適化して性能を向上させる「BOLT」、Facebookがオープンソースで公開。言語やコンパイラに依存せず高速化
  • C#でTypeをキーにしたDictionaryのパフォーマンス比較と最速コードの実装 - Grani Engineering Blog

    CTOの河合(@neuecc)です。今回はパフォーマンス比較もそうなのですが、どちらかというと、それを具体的な例にして、マイクロベンチマークの測り方の説明をしたいと思っています。その具体的な例、題材なのですが、特に動的コード生成においては、Typeをキーにして生成したデリゲートをキャッシュすることがよくあります。その場合に最速なのはジェネリッククラスを一つ作って、そこに貯めることで public static class Cache<T> { public static Func<T> cache; } 最速に取り出すことが出来ます。これはEqualityComparer<T>.Defaultなどでも使われている、覚えておきたいC#テクニックの一つです。とはいえ、常に必ずしもTを元にして取り出せるわけではなく、Typeをキーにした辞書を作って、そこから取り出すケースも多いでしょう。 具体的

    C#でTypeをキーにしたDictionaryのパフォーマンス比較と最速コードの実装 - Grani Engineering Blog
    vcc
    vcc 2018/06/11
    マイクロベンチマークにはBenchmarkDotNetを使う。数字の信頼性が高くなる。マイクロベンチマークを正しくやるのはかなり難しい、ウォームアップ、GC、JITの影響、メモリ計測
  • TechCrunch

    Humane’s Ai Pin promises an ‘ambient computing’ future for $699 (plus $24 a month) After months of leaks and teases, the extremely hyped wearer device has finally officially been revealed -- it arrives 11/16 Brian Heater

    TechCrunch
    vcc
    vcc 2018/03/28
    開発途上のCatapultで平均3000件/秒、最高4142件/秒の処理性能を実証。Hyperledger Fabric v0.6とEthereumで毎秒数十~百件程度が上限。bitFlyerのMiyabiを用いた実証実験で秒間1500取引の能力を確認。
  • Qualcomm、サーバ用ARM SoCを発表

    Qualcomm、サーバ用ARM SoCを発表:Intel Xeonの競合品と位置付け(2/2 ページ) Intel「Xeon」の競合品、堂々と言及 Centriqの技術的な詳細の多くは、2017年初めに開催された「Hot Chips」と「Linley Group Processor Conference」で既に発表されていた。その際、クロック速度、価格帯、電力要件については明らかにされなかったが、ここにきて全ての詳細がそろった。 Intelのサーバ向けプロセッサ「Xeon」は、TDP(熱設計電力)が200Wを超える製品が多いが、Centriqの場合、それよりもかなり低い120Wであるという。 Qualcommによると、Centriqの最上位プロセッサは、クロック速度が2.2GHz、ブーストクロックが2.6GHzだという。熱スロットリングが作動するまで、全てのコアで2.6GHzのブーストク

    Qualcomm、サーバ用ARM SoCを発表
    vcc
    vcc 2017/11/16
    Centriq 2460は、48コアと60MBのL3キャッシュ、2.6GHz、TDP120W。Intelの「Xeon Platinum 8180」プロセッサの競合製品と位置付けている。Xeon Platinum 8180は、28コア、56スレッド、L3キャッシュが38.5MB、2.5GHz、TDP205W。
  • ファイルシステムよりも35%高速に | POSTD

    1. 概要 SQLiteを使うと小さなBLOB(例:サムネイル画像など)を読み書きする場合、fread()やfwrite()を使って個別のファイル上に記録されたBLOBを読み書きするよりも35%も速く (*1) 読み書きができます。 さらに、10キロバイトのBLOBを扱うようなSQLiteデータベースを考えた場合、個別のファイルにそれぞれのBLOBを格納する場合に比べてディスク領域を約20%も節約可能です。 このようなパフォーマンスの差が生じる理由は、(私たちの考えでは)SQLiteデータベースの場合、open()やclose()システムコールが呼び出されるのが1回だけなのに対して、個別のファイルに格納されているBLOBを使用する場合は、open()やclose()がBLOBの数だけ呼び出されるためだと思われます。どうやらopen()とclose()を呼び出すオーバーヘッドは、データベース

    ファイルシステムよりも35%高速に | POSTD
  • 高速M.2 SSD初導入にもおすすめな「Samsung 960 EVO 500GB」をレビュー : 自作とゲームと趣味の日々

    2017年01月05日01:43 (注:商品価格は執筆当時のものです。販売ページリンクにはアフィリエイトを含みます) 高速M.2 SSD初導入にもおすすめな「Samsung 960 EVO 500GB」をレビュー wisteriear コメント(11) タグ :#ストレージ_レビュー#M.2_SSD#NVMe_SSD#レビュー#スポンサード_レビュー#NVMe_SSD_レビュー#SSD_レビュー#M.2_SSD_レビュー スポンサードリンク 国内でも12月に発売されたSamsungの新型NVMe M.2 SSDの廉価モデル「Samsung 960 EVO 500GB」を日サムスン社からお借りできたのでレビューします。個人的に米尼から個人輸入して先日レビューしたSamsung 960 PRO(レビュー記事)と比較しながらSamsung 960 EVOの性能をチェックしていきます。 Sams

    高速M.2 SSD初導入にもおすすめな「Samsung 960 EVO 500GB」をレビュー : 自作とゲームと趣味の日々
    vcc
    vcc 2017/08/21
    960 EVOでは書き込みサイズが20GBを超えたあたりで書き込み速度が600MB/s程度まで落ちる。Samsung 960 EVOはSLCキャッシュ容量を超える書き込みが発生するとライト速度が低下します。