コンテンツへスキップ ナビゲーションに移動

まったり勉強ノート

  • ホーム
  • プロフィール
  • お問い合わせ
  • プライバシーポリシー
  • サイトマップ

GPU

  1. HOME
  2. GPU
プログラミング
3月 18, 2023 / 最終更新日時 : 3月 18, 2023 Shuji Suzuki (shu) プログラミング

PyTorch 2.0の新機能「torch.compile」使ってみた

今回は3/16についに出たPyTorch 2.0の目玉機能である「torch.comple」について実際に動かしてみて計算時間を測定してみたので、そのまとめになります。 時間計測の部分で測定に使ったコードはここにあげてあ […]

2月 19, 2023 / 最終更新日時 : 2月 19, 2023 Shuji Suzuki (shu) プログラミング

CUDAの高速化の復習2023年版 Histogram(主にatomicAdd)編

Reduction、vectrized memory accessに続き、今回はhistogramを題材にして主にatomicAddのパフォーマンスが最近どうなっているのかを見ていきたいと思います。 Histogramは […]

2月 14, 2023 / 最終更新日時 : 2月 18, 2023 Shuji Suzuki (shu) プログラミング

CUDAの高速化の復習2023年版 Vectorized Memory Access編

前回Reductionを例に今時のCUDAの高速化で何が効いているのか?を確認したまとめの記事を書きました。今回はその中には登場しなかったCUDAの高速化テクニックの「Vectorized Memory Access」が […]

5月 10, 2021 / 最終更新日時 : 5月 10, 2021 Shuji Suzuki (shu) プログラミング

PyTorchのPERFORMANCE TUNING GUIDEの効果を確認してみる その2 「Fuse pointwise operations」

PyTorchには「PERFORMANCE TUNING GUIDE」という学習を速くするためのテクニック集があります。このドキュメントでは個々のテクニックでどれくらい速くなるか具体的な数値が示されていないので、それを確 […]

3月 21, 2021 / 最終更新日時 : 3月 21, 2021 Shuji Suzuki (shu) プログラミング

PyTorchでGPUの計算時間を正しく計測する

今回の記事ではPyTorchでGPUで実行した関数の計算時間を正しく測定する方法とその後に詳しい説明をしていきます。 はじめに 仕事がらPyTorchで高速な学習方法をいろいろ調べることがよくあります。その際、blog記 […]

Shuji Suzuki (shu)

shuji-suzuki

バイオインフォとHPCっぽいことを研究してる企業研究者。主に調べたり勉強したりしたことのまとめを書いてます。

最近の投稿

書評
[書評] 老舗書店「有隣堂」が作る企業YouTubeの世界 ー 面白YouTubeチャンネルの裏側が知りたい人向けな一冊
3月 27, 2023
育休中の1日のスケジュール
育休前の自分に伝えたい育休の過ごし方
3月 21, 2023
書評
[書評] エンジニアリングマネージャーのしごと ー マネージャーになって悩んだらまず読んでほしい一冊
3月 20, 2023
プログラミング
PyTorch 2.0の新機能「torch.compile」使ってみた
3月 18, 2023
[勉強ノート] 「拡散モデル データ生成技術の数理」 2.3 デノイジング拡散確率モデル
3月 16, 2023

人気の投稿

最近の投稿

書評

[書評] 老舗書店「有隣堂」が作る企業YouTubeの世界 ー 面白YouTubeチャンネルの裏側が知りたい人向けな一冊

3月 27, 2023
育休中の1日のスケジュール

育休前の自分に伝えたい育休の過ごし方

3月 21, 2023
書評

[書評] エンジニアリングマネージャーのしごと ー マネージャーになって悩んだらまず読んでほしい一冊

3月 20, 2023
プログラミング

PyTorch 2.0の新機能「torch.compile」使ってみた

3月 18, 2023

[勉強ノート] 「拡散モデル データ生成技術の数理」 2.3 デノイジング拡散確率モデル

3月 16, 2023
書評

[書評] ユーザーの問題解決とプロダクトの成功を導く エンジニアのためのドキュメントライティング ー 開発したプログラムのドキュメントを書こうと思ったら読む本

3月 13, 2023
スコアベースモデルを利用してサンプリングした結果

[勉強ノート] 「拡散モデル データ生成技術の数理」 2.2 スコアベースモデル

3月 8, 2023
書評

[書評] 評価指標入門〜データサイエンスとビジネスをつなぐ架け橋 ー ビジネスに機械学習を使いたいと思ったら読んでほしい1冊

3月 6, 2023
ランジュバン・モンテカルロ法でサンプリングした結果

[勉強ノート] 「拡散モデル データ生成技術の数理」 1.5.1 ランジュバン・モンテカルロ法

3月 3, 2023

[書評] Optunaによるブラックボックス最適化 ー Optunaを使っている人、使ってない人みんなに勧めたい1冊

2月 24, 2023

カテゴリー

  • プログラミング
  • 書評
  • 未分類

アーカイブ

  • 2023年3月
  • 2023年2月
  • 2023年1月
  • 2022年12月
  • 2022年11月
  • 2022年5月
  • 2022年4月
  • 2022年3月
  • 2022年2月
  • 2021年12月
  • 2021年11月
  • 2021年10月
  • 2021年5月
  • 2021年4月
  • 2021年3月
  • 2021年2月

アーカイブ

  • 2023年3月
  • 2023年2月
  • 2023年1月
  • 2022年12月
  • 2022年11月
  • 2022年5月
  • 2022年4月
  • 2022年3月
  • 2022年2月
  • 2021年12月
  • 2021年11月
  • 2021年10月
  • 2021年5月
  • 2021年4月
  • 2021年3月
  • 2021年2月

カテゴリー

  • プログラミング
  • 書評
  • 未分類
  • ホーム
  • プロフィール
  • お問い合わせ
  • プライバシーポリシー
  • サイトマップ

Copyright © まったり勉強ノート All Rights Reserved.

Powered by WordPress with Lightning Theme & VK All in One Expansion Unit by Vektor,Inc. technology.

MENU
  • ホーム
  • プロフィール
  • お問い合わせ
  • プライバシーポリシー
  • サイトマップ
PAGE TOP Secured By miniOrange