Sam Shleifer

Получаване на мой собствен потребителски профил

Позовавания

	Всички	От 2019
Позовавания	10175	10162
h-индекс	16	16
i10-индекс	17	17

4300

2150

1075

3225

20192020202120222023202428 469 1300 2268 4296 1772

Следене

Sam Shleifer

Facebook AI Research

Потвърден имейл адрес: fb.com

natural_language_processing Deep Learning


Заглавие Сортиране по цитати Сортиране по година Сортиране по заглавие	Позовавания Позовавания	Година
Transformers: State-of-the-art natural language processing T Wolf, L Debut, V Sanh, J Chaumond, C Delangue, A Moi, P Cistac, ... Proceedings of the 2020 conference on empirical methods in natural language …, 2020	4211	2020
Huggingface's transformers: State-of-the-art natural language processing T Wolf, L Debut, V Sanh, J Chaumond, C Delangue, A Moi, P Cistac, ... arXiv preprint arXiv:1910.03771, 2019	2798	2019
Opt: Open pre-trained transformer language models S Zhang, S Roller, N Goyal, M Artetxe, M Chen, S Chen, C Dewan, ... arXiv preprint arXiv:2205.01068, 2022	1662	2022
Beyond the imitation game: Quantifying and extrapolating the capabilities of language models A Srivastava, A Rastogi, A Rao, AAM Shoeb, A Abid, A Fisch, AR Brown, ... arXiv preprint arXiv:2206.04615, 2022	750	2022
8-bit optimizers via block-wise quantization T Dettmers, M Lewis, S Shleifer, L Zettlemoyer arXiv preprint arXiv:2110.02861, 2021	130	2021
Pre-trained summarization distillation S Shleifer, AM Rush arXiv preprint arXiv:2010.13002, 2020	89	2020
Pytorch fsdp: experiences on scaling fully sharded data parallel Y Zhao, A Gu, R Varma, L Luo, CC Huang, M Xu, L Wright, H Shojanazeri, ... arXiv preprint arXiv:2304.11277, 2023	77	2023
Efficient large scale language modeling with mixtures of experts M Artetxe, S Bhosale, N Goyal, T Mihaylov, M Ott, S Shleifer, XV Lin, J Du, ... arXiv preprint arXiv:2112.10684, 2021	74	2021
Opt: Open pre-trained transformer language models, 2022 S Zhang, S Roller, N Goyal, M Artetxe, M Chen, S Chen, C Dewan, ... URL https://arxiv. org/abs/2205.01068 3, 19-0, 2023	73	2023
Huggingface’s transformers: State-of-the-art natural language processing. arXiv T Wolf, L Debut, V Sanh, J Chaumond, C Delangue, A Moi, P Cistac, ... arXiv preprint arXiv:1910.03771, 2019	68	2019
Low resource text classification with ulmfit and backtranslation S Shleifer arXiv preprint arXiv:1903.09244, 2019	66	2019
Normformer: Improved transformer pretraining with extra normalization S Shleifer, J Weston, M Ott arXiv preprint arXiv:2110.09456, 2021	43	2021
Few-shot learning with multilingual language models XV Lin, T Mihaylov, M Artetxe, T Wang, S Chen, D Simig, M Ott, N Goyal, ... arXiv preprint arXiv:2112.10668, 2021	39	2021
Few-shot learning with multilingual generative language models XV Lin, T Mihaylov, M Artetxe, T Wang, S Chen, D Simig, M Ott, N Goyal, ... Proceedings of the 2022 Conference on Empirical Methods in Natural Language …, 2022	35	2022
Incrementally improving graph WaveNet performance on traffic prediction S Shleifer, C McCreery, V Chitters arXiv preprint arXiv:1912.07390, 2019	21	2019
Using small proxy datasets to accelerate hyperparameter search S Shleifer, E Prokop arXiv preprint arXiv:1906.04887, 2019	21	2019
Efficient language modeling with sparse all-mlp P Yu, M Artetxe, M Ott, S Shleifer, H Gong, V Stoyanov, X Li arXiv preprint arXiv:2203.06850, 2022	11	2022
Shen Li Y Zhao, A Gu, R Varma, L Luo, CC Huang, M Xu, L Wright, H Shojanazeri, ... Pytorch fsdp: Experiences on scaling fully sharded data parallel, 2023	7	2023
Classification As Decoder: Trading Flexibility For Control In Neural Dialogue S Shleifer, M Chablani, N Katariya, A Kannan, X Amatriain arXiv preprint arXiv:1910.03476, 2019		2019
Classification as Decoder: Trading Flexibility for Control in Multi Domain Dialogue S Shleifer, M Chablani, N Katariya, A Kannan, X Amatriain		2019

Системата не може да изпълни операцията сега. Опитайте отново по-късно.

Статии 1–20

Позовавания годишно

Дублирани описания

Обединени библиографски описания

Добавяне на съавториСъавтори

Следене

Позовавания