Huck Yang

上席研究員, NVIDIA Research

ジョージア工科大学 博士

プロフィール

音声言語アライメント、効率的な適応手法、ロバストな機械学習システムの研究に従事。NVIDIAに入社する前は、Amazon AGI、Google(現DeepMind)、日立中央研究所(東京)にて研究開発に携わる。

最新ニュース

すべて見る →
2025年1月25日

ICLR 2025に6本、EMNLP 2025にチュートリアルが採択

詳細 →
2024年10月2日

EMNLP 2024に3本、NeurIPS 2024に1本採択

詳細 →
2024年5月2日

ACL 2024に口頭発表1本と米国特許1件が採択

詳細 →

研究分野

音声言語アライメント

大規模言語モデルを音声認識に適応させるためのクロスモーダルアライメントアルゴリズムの研究。タスク活性化プロンプティングやLLM-ASRフレームワークを用いたロバストな音声理解の実現。

LLM 音声認識 クロスモーダル

推論時適応と効率化

シーケンスモデリングのための効率的な適応手法の開発。文脈内学習やプロンプトチューニングを用いた推論時のモデル性能向上。

スケーリング 効率化 プロンプト

ロバスト評価と因果推論

深層学習システムのためのロバスト評価フレームワークと因果推論手法の構築。プライバシー保護アルゴリズムと介入耐性アーキテクチャの研究。

因果推論 ロバスト性 プライバシー

チュートリアル

EMNLP 2025

大規模言語モデルを用いた音声対話エージェント

LLMと音声認識システムの統合に関する包括的なチュートリアル。タスク活性化プロンプティングとクロスモーダルアライメント技術を解説。

ICASSP 2024

音声言語モデリングにおける効率的な適応手法

音声モデルのためのパラメータ効率的な適応手法の紹介。プロンプトチューニングと文脈内学習アプローチを解説。

Interspeech 2023

音声基盤モデルのためのクロスモーダルアライメント

大規模言語モデルを用いたロバストな音声認識技術の概要。ノイズ耐性のあるアーキテクチャに焦点を当てる。