Yashesh Gaur

Получаване на мой собствен потребителски профил

Позовавания

	Всички	От 2019
Позовавания	1586	1488
h-индекс	21	21
i10-индекс	37	33

440

220

110

330

2016201720182019202020212022202320248 19 63 90 103 298 357 436 202

Публичен достъп

Преглед на всички

1 статия

0 статии

налични

неналични

Въз основа на изисквания при финансирането

Съавтори

Jinyu LiPartner Applied Science Manager, MicrosoftПотвърден имейл адрес: microsoft.com
Zhong MengGoogleПотвърден имейл адрес: google.com
Naoyuki KandaMicrosoftПотвърден имейл адрес: microsoft.com
Yifan GongPrincipal Science Manager, Microsoft Corp.Потвърден имейл адрес: microsoft.com
Anuroop SriramMeta FAIRПотвърден имейл адрес: alumni.cmu.edu
Sanjeev SatheeshStanford UniversityПотвърден имейл адрес: stanford.edu
Eric BattenbergGoogle ResearchПотвърден имейл адрес: google.com
Adam CoatesPreviously Apple, Khosla Ventures, Baidu SVAIL, Stanford PhDПотвърден имейл адрес: cs.stanford.edu
Jeffrey P. BighamCarnegie Mellon University & AppleПотвърден имейл адрес: cs.cmu.edu
Florian MetzeCarnegie Mellon University; Meta AIПотвърден имейл адрес: andrew.cmu.edu
Yajie MiaoCarnegie Mellon UniversityПотвърден имейл адрес: cs.cmu.edu

Следене

Yashesh Gaur

Meta AI

Потвърден имейл адрес: cs.cmu.edu

Machine Learning Speech & Language


Заглавие Сортиране по цитати Сортиране по година Сортиране по заглавие	Позовавания Позовавания	Година
Exploring neural transducers for end-to-end speech recognition E Battenberg, J Chen, R Child, A Coates, YGY Li, H Liu, S Satheesh, ... 2017 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU …, 2017	270*	2017
On the comparison of popular end-to-end models for large scale speech recognition J Li, Y Wu, Y Gaur, C Wang, R Zhao, S Liu arXiv preprint arXiv:2005.14327, 2020	142	2020
Internal language model estimation for domain-adaptive end-to-end speech recognition Z Meng, S Parthasarathy, E Sun, Y Gaur, N Kanda, L Lu, X Chen, R Zhao, ... 2021 IEEE Spoken Language Technology Workshop (SLT), 243-250, 2021	96	2021
Serialized output training for end-to-end overlapped speech recognition N Kanda, Y Gaur, X Wang, Z Meng, T Yoshioka arXiv preprint arXiv:2003.12687, 2020	94	2020
Joint speaker counting, speech recognition, and speaker identification for overlapped speech of any number of speakers N Kanda, Y Gaur, X Wang, Z Meng, Z Chen, T Zhou, T Yoshioka arXiv preprint arXiv:2006.10930, 2020	70	2020
Robust speech recognition using generative adversarial networks A Sriram, H Jun, Y Gaur, S Satheesh 2018 IEEE international conference on acoustics, speech and signal …, 2018	69	2018
The effects of automatic speech recognition quality on human transcription latency Y Gaur, WS Lasecki, F Metze, JP Bigham Proceedings of the 13th International Web for All Conference, 1-8, 2016	56	2016
Minimum latency training strategies for streaming sequence-to-sequence ASR H Inaguma, Y Gaur, L Lu, J Li, Y Gong ICASSP 2020-2020 IEEE International Conference on Acoustics, Speech and …, 2020	54	2020
Domain adaptation via teacher-student learning for end-to-end speech recognition Z Meng, J Li, Y Gaur, Y Gong 2019 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU …, 2019	50	2019
Internal language model training for domain-adaptive end-to-end speech recognition Z Meng, N Kanda, Y Gaur, S Parthasarathy, E Sun, L Lu, X Chen, J Li, ... ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and …, 2021	48	2021
Investigation of end-to-end speaker-attributed ASR for continuous multi-talker recordings N Kanda, X Chang, Y Gaur, X Wang, Z Meng, Z Chen, T Yoshioka 2021 IEEE Spoken Language Technology Workshop (SLT), 809-816, 2021	41	2021
A Federated Approach in Training Acoustic Models. D Dimitriadis, RG Ken'ichi Kumatani, R Gmyr, Y Gaur, SE Eskimez Interspeech, 981-985, 2020	41	2020
Speaker adaptation for attention-based end-to-end speech recognition Z Meng, Y Gaur, J Li, Y Gong arXiv preprint arXiv:1911.03762, 2019	41	2019
Streaming multi-talker ASR with token-level serialized output training N Kanda, J Wu, Y Wu, X Xiao, Z Meng, X Wang, Y Gaur, Z Chen, J Li, ... arXiv preprint arXiv:2202.00842, 2022	39	2022
Viola: Unified codec language models for speech recognition, synthesis, and translation T Wang, L Zhou, Z Zhang, Y Wu, S Liu, Y Gaur, Z Chen, J Li, F Wei arXiv preprint arXiv:2305.16107, 2023	34	2023
End-to-end speaker-attributed ASR with transformer N Kanda, G Ye, Y Gaur, X Wang, Z Meng, Z Chen, T Yoshioka arXiv preprint arXiv:2104.02128, 2021	34	2021
Large-scale pre-training of end-to-end multi-talker ASR for meeting transcription with single distant microphone N Kanda, G Ye, Y Wu, Y Gaur, X Wang, Z Meng, Z Chen, T Yoshioka arXiv preprint arXiv:2103.16776, 2021	34	2021
Internal language model adaptation with text-only data for end-to-end speech recognition Z Meng, Y Gaur, N Kanda, J Li, X Chen, Y Wu, Y Gong arXiv preprint arXiv:2110.05354, 2021	25	2021
On decoder-only architecture for speech-to-text and large language model integration J Wu, Y Gaur, Z Chen, L Zhou, Y Zhu, T Wang, J Li, S Liu, B Ren, L Liu, ... 2023 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU), 1-8, 2023	23	2023
Systems and methods for robust speech recognition using generative adversarial networks A Sriram, HW Jun, G Yashesh, S Satheesh US Patent 10,971,142, 2021	22	2021

Системата не може да изпълни операцията сега. Опитайте отново по-късно.

Статии 1–20

Позовавания годишно

Дублирани описания

Обединени библиографски описания

Добавяне на съавториСъавтори

Следене

Позовавания

Съавтори