Player FM - Internet Radio Done Right
159 subscribers
Checked 1M ago
اضافه شده در seven سال پیش
محتوای ارائه شده توسط Hajime Morrita , Jun Mukai. تمام محتوای پادکست شامل قسمتها، گرافیکها و توضیحات پادکست مستقیماً توسط Hajime Morrita , Jun Mukai یا شریک پلتفرم پادکست آنها آپلود و ارائه میشوند. اگر فکر میکنید شخصی بدون اجازه شما از اثر دارای حق نسخهبرداری شما استفاده میکند، میتوانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal
Player FM - برنامه پادکست
با برنامه Player FM !
با برنامه Player FM !
#133: Triton: An Intermediate Language and Compiler for Tiled Neural Network Computations
Manage episode 419436258 series 2151064
محتوای ارائه شده توسط Hajime Morrita , Jun Mukai. تمام محتوای پادکست شامل قسمتها، گرافیکها و توضیحات پادکست مستقیماً توسط Hajime Morrita , Jun Mukai یا شریک پلتفرم پادکست آنها آپلود و ارائه میشوند. اگر فکر میکنید شخصی بدون اجازه شما از اثر دارای حق نسخهبرداری شما استفاده میکند، میتوانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal
CUDA を書かずに済む GPU カーネルの DSL について森田が読みました。ご意見感想などは Reddit やおたより投書箱にお寄せください。iTunes のレビューや星もよろしくね。
- Triton: An Intermediate Language and Compiler for Tiled Neural Network Computations
- Introducing Triton: Open-source GPU programming for neural networks | OpenAI
- Welcome to Triton’s documentation! — Triton documentation
- Hello Triton.ipynb – Colab
- #01: Tensor Comprehensions, Rust Belt – Misreading Chat
- #23 – Halide: Decoupling Algorithms from Schedules for High-Performance Image Processing – Misreading Chat
- #27 – Julia: A Fresh Approach to Numerical Computing – Misreading Chat
147 قسمت
Manage episode 419436258 series 2151064
محتوای ارائه شده توسط Hajime Morrita , Jun Mukai. تمام محتوای پادکست شامل قسمتها، گرافیکها و توضیحات پادکست مستقیماً توسط Hajime Morrita , Jun Mukai یا شریک پلتفرم پادکست آنها آپلود و ارائه میشوند. اگر فکر میکنید شخصی بدون اجازه شما از اثر دارای حق نسخهبرداری شما استفاده میکند، میتوانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal
CUDA を書かずに済む GPU カーネルの DSL について森田が読みました。ご意見感想などは Reddit やおたより投書箱にお寄せください。iTunes のレビューや星もよろしくね。
- Triton: An Intermediate Language and Compiler for Tiled Neural Network Computations
- Introducing Triton: Open-source GPU programming for neural networks | OpenAI
- Welcome to Triton’s documentation! — Triton documentation
- Hello Triton.ipynb – Colab
- #01: Tensor Comprehensions, Rust Belt – Misreading Chat
- #23 – Halide: Decoupling Algorithms from Schedules for High-Performance Image Processing – Misreading Chat
- #27 – Julia: A Fresh Approach to Numerical Computing – Misreading Chat
147 قسمت
همه قسمت ها
×GitHub の Issue を読んでバグを直すエーアイについて森田が読みました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [2310.06770] SWE-bench: Can Language Models Resolve Real-World GitHub Issues? [2405.15793] SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering SWE-bench Introducing SWE-bench Verified | OpenAI The new Claude 3.5 Sonnet, Computer Use, and Building SOTA Agents — with Erik Schluntz, Anthropic…
M
Misreading Chat


Rust を Linux カーネルへで使う取り組みの進捗を 向井 がウォッチしました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 An Empirical Study of Rust-for-Linux: The Success, Dissatisfaction, and Compromise | USENIX Rust for Linux
Google SQL の新しい文法を森田が紹介しました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 SQL Has Problems. We Can Fix Them: Pipe Syntax In SQL PRQL Pipe syntax | BigQuery | Google Cloud SQLite Forum: Interesting paper from Google on pipe syntax on SQL
M
Misreading Chat


1 #140: GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models 39:54
LLM にひっかけ算数問題を出してみる話を 向井 が読みました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [2410.05229] GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models GitHub – openai/grade-school-math
M
Misreading Chat


写真を集めてシーンをレンダリングするニューラルネットを森田が読みました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis NeRF Tutorial ECCV 2022 illuminate.google.com
大きなモデルから小さなモデルを作るテクニックを 向井 が回願しました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [1503.02531] Distilling the Knowledge in a Neural Network
ストリームにパーセンタイルを計算したい森田が教科書を読みました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [1603.05346v2] Optimal Quantile Approximation in Streams Small Summaries for Big Data Data Types – Presto 0.288 Documentation Estimating Percentile Values | Snowflake Documentation KLL sketch vs t-digest – DataSketches…
学部生にも実装できるストリームの要素カウントアルゴリズムを 向井 が試しました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [2301.10191] Distinct Elements in Streams: An Algorithm for the (Text) Book The CVM Algorithm for Estimating Distinct Elements in Streams Computer scientists invent an efficient new way to count | Hacker News…
行列の掛け算が得意なハードウェアについて森田が読みました。ご意見感想などは Reddit やおたより投書箱にお寄せください。iTunes のレビューや星もよろしくね。 [1704.04760] In-Datacenter Performance Analysis of a Tensor Processing Unit Systolic Arrays – an overview | ScienceDirect Topics Pallas: a JAX kernel language — JAX documentation About Groq – Fast AI Inference The Design Process for Google’s Training Chips: TPUv2 and TPUv3 | IEEE Journals & Magazine | IEEE Xplore…
巨大 ML モデルの軽量 fine-tuning 手法を 向井 が読みました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [2106.09685] LoRA: Low-Rank Adaptation of Large Language Models
M
Misreading Chat


CUDA を書かずに済む GPU カーネルの DSL について森田が読みました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 Triton: An Intermediate Language and Compiler for Tiled Neural Network Computations Introducing Triton: Open-source GPU programming for neural networks | OpenAI Welcome to Triton’s documentation! — Triton documentation Hello Triton.ipynb – Colab #01: Tensor Comprehensions, Rust Belt – Misreading Chat #23 – Halide: Decoupling Algorithms from Schedules for High-Performance Image Processing – Misreading Chat #27 – Julia: A Fresh Approach to Numerical Computing – Misreading Chat…
Stable Diffusion の元論文を 向井 が読みました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [2112.10752] High-Resolution Image Synthesis with Latent Diffusion Models [2105.05233] Diffusion Models Beat GANs on Image Synthesis Classifier-Free Diffusion Guidance | OpenReview What are Diffusion Models? | Lil’Log…
M
Misreading Chat


CUDA で書かれた PyTorch 用カーネルに森田が玉砕しました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [2205.14135] FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness GitHub – Dao-AILab/flash-attention: Fast and memory-efficient exact attention GitHub – NVIDIA/apex: A PyTorch Extension: Tools for easy mixed precision and distributed training in Pytorch [2307.08691] FlashAttention-2: Faster Attention with Better Parallelism and Work Partitioning [2112.05682] Self-attention Does Not Need $O(n^2)$ Memory GitHub – tspeterkim/flash-attention-minimal: Flash Attention in ~100 lines of CUDA (forward pass only)…
向井 が画像生成の拡散モデルに入門しました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 Diffusion models from scratch [1503.03585] Deep Unsupervised Learning using Nonequilibrium Thermodynamics [2006.11239] Denoising Diffusion Probabilistic Models
森田が飽きずに CUDA の教科書を読んでます。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 Programming Massively Parallel Processors: A Hands-on Approach ( Amazon.co.jp , Elsevier ) NVIDIA H100 Tensor Core GPU Architecture Overview
به Player FM خوش آمدید!
Player FM در سراسر وب را برای یافتن پادکست های با کیفیت اسکن می کند تا همین الان لذت ببرید. این بهترین برنامه ی پادکست است که در اندروید، آیفون و وب کار می کند. ثبت نام کنید تا اشتراک های شما در بین دستگاه های مختلف همگام سازی شود.