コンテンツへスキップ ナビゲーションに移動

まったり勉強ノート

  • ホーム
  • プロフィール
  • お問い合わせ
  • プライバシーポリシー
  • サイトマップ

CUDA

  1. HOME
  2. CUDA
2月 19, 2023 / 最終更新日時 : 2月 19, 2023 Shuji Suzuki (shu) プログラミング

CUDAの高速化の復習2023年版 Histogram(主にatomicAdd)編

Reduction、vectrized memory accessに続き、今回はhistogramを題材にして主にatomicAddのパフォーマンスが最近どうなっているのかを見ていきたいと思います。 Histogramは […]

2月 14, 2023 / 最終更新日時 : 2月 18, 2023 Shuji Suzuki (shu) プログラミング

CUDAの高速化の復習2023年版 Vectorized Memory Access編

前回Reductionを例に今時のCUDAの高速化で何が効いているのか?を確認したまとめの記事を書きました。今回はその中には登場しなかったCUDAの高速化テクニックの「Vectorized Memory Access」が […]

1月 29, 2023 / 最終更新日時 : 1月 29, 2023 Shuji Suzuki (shu) プログラミング

CUDAの高速化の復習2023年版 Reduction編

今回は最近のCUDA Samplesのコードを参考にCUDAでreductionを速くするテクニックのまとめになります。 私はCUDAを2009年のころから研究で使っていました。当時は頑張って勉強していたので自分の研究分 […]

12月 20, 2022 / 最終更新日時 : 12月 20, 2022 Shuji Suzuki (shu) プログラミング

Visual Studio Codeを使ってCUDAのコードを書く

はじめに 最近、久しぶりにCUDAでコードを書きそうな状況になってきました。このため、ここ数日CUDAの開発環境の準備をしているところです。その際、周りの人が結構Visual Studio Code (VSCode) を […]

10月 23, 2021 / 最終更新日時 : 10月 23, 2021 Shuji Suzuki (shu) プログラミング

PyTorch 1.10の新機能「CUDA Graphs」のパフォーマンスを測定してみる

はじめに 10/21にPyTorch 1.10がリリースされ、今回も面白そうな機能が追加されました。個人的には楽しみにしていた「CUDA Graphs」のAPIのベータ版が追加されたということで早速試してみました。今回は […]

3月 21, 2021 / 最終更新日時 : 3月 21, 2021 Shuji Suzuki (shu) プログラミング

PyTorchでGPUの計算時間を正しく計測する

今回の記事ではPyTorchでGPUで実行した関数の計算時間を正しく測定する方法とその後に詳しい説明をしていきます。 はじめに 仕事がらPyTorchで高速な学習方法をいろいろ調べることがよくあります。その際、blog記 […]

Shuji Suzuki (shu)

shuji-suzuki

バイオインフォとHPCっぽいことを研究してる企業研究者。主に調べたり勉強したりしたことのまとめを書いてます。

最近の投稿

育休中の1日のスケジュール
育休前の自分に伝えたい育休の過ごし方
3月 21, 2023
書評
[書評] エンジニアリングマネージャーのしごと ー マネージャーになって悩んだらまず読んでほしい一冊
3月 20, 2023
プログラミング
PyTorch 2.0の新機能「torch.compile」使ってみた
3月 18, 2023
[勉強ノート] 「拡散モデル データ生成技術の数理」 2.3 デノイジング拡散確率モデル
3月 16, 2023
書評
[書評] ユーザーの問題解決とプロダクトの成功を導く エンジニアのためのドキュメントライティング ー 開発したプログラムのドキュメントを書こうと思ったら読む本
3月 13, 2023

人気の投稿

最近の投稿

育休中の1日のスケジュール

育休前の自分に伝えたい育休の過ごし方

3月 21, 2023
書評

[書評] エンジニアリングマネージャーのしごと ー マネージャーになって悩んだらまず読んでほしい一冊

3月 20, 2023
プログラミング

PyTorch 2.0の新機能「torch.compile」使ってみた

3月 18, 2023

[勉強ノート] 「拡散モデル データ生成技術の数理」 2.3 デノイジング拡散確率モデル

3月 16, 2023
書評

[書評] ユーザーの問題解決とプロダクトの成功を導く エンジニアのためのドキュメントライティング ー 開発したプログラムのドキュメントを書こうと思ったら読む本

3月 13, 2023
スコアベースモデルを利用してサンプリングした結果

[勉強ノート] 「拡散モデル データ生成技術の数理」 2.2 スコアベースモデル

3月 8, 2023
書評

[書評] 評価指標入門〜データサイエンスとビジネスをつなぐ架け橋 ー ビジネスに機械学習を使いたいと思ったら読んでほしい1冊

3月 6, 2023
ランジュバン・モンテカルロ法でサンプリングした結果

[勉強ノート] 「拡散モデル データ生成技術の数理」 1.5.1 ランジュバン・モンテカルロ法

3月 3, 2023

[書評] Optunaによるブラックボックス最適化 ー Optunaを使っている人、使ってない人みんなに勧めたい1冊

2月 24, 2023

[書評] 拡散モデル データ生成技術の数理 ー 目覚ましい画像生成の発展の裏側を知りたい人へ

2月 23, 2023

カテゴリー

  • プログラミング
  • 書評
  • 未分類

アーカイブ

  • 2023年3月
  • 2023年2月
  • 2023年1月
  • 2022年12月
  • 2022年11月
  • 2022年5月
  • 2022年4月
  • 2022年3月
  • 2022年2月
  • 2021年12月
  • 2021年11月
  • 2021年10月
  • 2021年5月
  • 2021年4月
  • 2021年3月
  • 2021年2月

アーカイブ

  • 2023年3月
  • 2023年2月
  • 2023年1月
  • 2022年12月
  • 2022年11月
  • 2022年5月
  • 2022年4月
  • 2022年3月
  • 2022年2月
  • 2021年12月
  • 2021年11月
  • 2021年10月
  • 2021年5月
  • 2021年4月
  • 2021年3月
  • 2021年2月

カテゴリー

  • プログラミング
  • 書評
  • 未分類
  • ホーム
  • プロフィール
  • お問い合わせ
  • プライバシーポリシー
  • サイトマップ

Copyright © まったり勉強ノート All Rights Reserved.

Powered by WordPress with Lightning Theme & VK All in One Expansion Unit by Vektor,Inc. technology.

MENU
  • ホーム
  • プロフィール
  • お問い合わせ
  • プライバシーポリシー
  • サイトマップ
PAGE TOP Secured By miniOrange