Jan Leike

Получаване на мой собствен потребителски профил

Позовавания

	Всички	От 2019
Позовавания	14475	14026
h-индекс	26	22
i10-индекс	31	26

7000

3500

1750

5250

201520162017201820192020202120222023202446 60 87 191 295 365 501 1129 6925 4759

Публичен достъп

Преглед на всички

10 статии

0 статии

налични

неналични

Въз основа на изисквания при финансирането

Съавтори

Jeffrey WuOpenAIПотвърден имейл адрес: openai.com
Paul ChristianoNational Institute of Standards and TechnologyПотвърден имейл адрес: nist.gov
John SchulmanResearch Scientist, OpenAIПотвърден имейл адрес: openai.com
Ryan LoweOpenAIПотвърден имейл адрес: openai.com
Marcus HutterResearcher@DeepMind & Professor at ANUПотвърден имейл адрес: anu.edu.au
Dario AmodeiCEO and Co-Founder at AnthropicПотвърден имейл адрес: anthropic.com
David Scott KruegerUniversity Assistant Professor, University of CambridgeПотвърден имейл адрес: cam.ac.uk
Matthias HeizmannUniversity of Stuttgart, GermanyПотвърден имейл адрес: heizmann.name
Tom EverittStaff Research Scientist at Google DeepMindПотвърден имейл адрес: google.com
Ilya SutskeverCo-Founder and Chief Scientist of OpenAIПотвърден имейл адрес: openai.com
Pushmeet KohliDeepMindПотвърден имейл адрес: google.com
Andreas PodelskiProfessor of Computer Science, Freiburg UniversityПотвърден имейл адрес: informatik.uni-freiburg.de
Tegan MaharajAssistant Professor at University of TorontoПотвърден имейл адрес: polymtl.ca
Geoffrey IrvingUK AI Safety Institute (AISI)Потвърден имейл адрес: naml.us
William SaundersOpenAIПотвърден имейл адрес: cs.toronto.edu
Adam GleaveCEO at FAR AIПотвърден имейл адрес: far.ai
Collin BurnsResearcher, OpenAIПотвърден имейл адрес: openai.com
Andrew TraskUniversity of Oxford and OpenMinedПотвърден имейл адрес: openmined.org

Следене

Jan Leike

OpenAI

Потвърден имейл адрес: openai.com - Начална страница

reinforcement learning deep learning agent alignment


Заглавие Сортиране по цитати Сортиране по година Сортиране по заглавие	Позовавания Позовавания	Година
Training language models to follow instructions with human feedback L Ouyang, J Wu, X Jiang, D Almeida, C Wainwright, P Mishkin, C Zhang, ... Advances in Neural Information Processing Systems 35, 27730-27744, 2022	6251	2022
Deep reinforcement learning from human preferences PF Christiano, J Leike, T Brown, M Martic, S Legg, D Amodei Advances in Neural Information Processing Systems 30, 4299-4307, 2017	2124	2017
Evaluating large language models trained on code M Chen, J Tworek, H Jun, Q Yuan, HPO Pinto, J Kaplan, H Edwards, ... arXiv preprint arXiv:2107.03374, 2021	2015	2021
GPT-4 technical report OpenAI arXiv, 2023	1510*	2023
Reward learning from human preferences and demonstrations in Atari B Ibarz, J Leike, T Pohlen, G Irving, S Legg, D Amodei Advances in Neural Information Processing Systems, 8011-8023, 2018	334	2018
AI Safety Gridworlds J Leike, M Martic, V Krakovna, PA Ortega, T Everitt, A Lefrancq, L Orseau, ... arXiv preprint arXiv:1711.09883, 2017	323	2017
Scalable agent alignment via reward modeling: a research direction J Leike, D Krueger, T Everitt, M Martic, V Maini, S Legg arXiv preprint arXiv:1811.07871, 2018	243	2018
Let's Verify Step by Step H Lightman, V Kosaraju, Y Burda, H Edwards, B Baker, T Lee, J Leike, ... arXiv preprint arXiv:2305.20050, 2023	198	2023
Learning to Understand Goal Specifications by Modelling Reward D Bahdanau, F Hill, J Leike, E Hughes, P Kohli, E Grefenstette arXiv preprint arXiv:1806.01946, 2018	193*	2018
Recursively summarizing books with human feedback J Wu, L Ouyang, DM Ziegler, N Stiennon, R Lowe, J Leike, P Christiano arXiv preprint arXiv:2109.10862, 2021	187	2021
Self-critiquing models for assisting human evaluators W Saunders, C Yeh, J Wu, S Bills, L Ouyang, J Ward, J Leike arXiv preprint arXiv:2206.05802, 2022	122	2022
Language models can explain neurons in language models S Bills, N Cammarata, D Mossing, H Tillman, L Gao, G Goh, I Sutskever, ... URL https://openaipublic. blob. core. windows. net/neuron-explainer/paper …, 2023	108	2023
Ranking Templates for Linear Loops J Leike, M Heizmann Logical Methods in Computer Science, 2015	95	2015
Learning human objectives by evaluating hypothetical behavior S Reddy, A Dragan, S Levine, S Legg, J Leike International Conference on Machine Learning, 8020-8029, 2020	78	2020
Linear ranking for linear lasso programs M Heizmann, J Hoenicke, J Leike, A Podelski Automated Technology for Verification and Analysis, 365-380, 2013	60	2013
Institutionalizing ethics in AI through broader impact requirements CEA Prunkl, C Ashurst, M Anderljung, H Webb, J Leike, A Dafoe Nature Machine Intelligence 3 (2), 104-110, 2021	55	2021
Geometric nontermination arguments J Leike, M Heizmann International Conference on Tools and Algorithms for the Construction and …, 2018	54*	2018
Hidden Incentives for Auto-Induced Distributional Shift D Krueger, T Maharaj, J Leike arXiv preprint arXiv:2009.09153, 2020	53*	2020
Quantifying Differences in Reward Functions A Gleave, M Dennis, S Legg, S Russell, J Leike arXiv preprint arXiv:2006.13900, 2020	53	2020
Weak-to-Strong Generalization: Eliciting Strong Capabilities With Weak Supervision C Burns, P Izmailov, JH Kirchner, B Baker, L Gao, L Aschenbrenner, ... arXiv preprint arXiv:2312.09390, 2023	47	2023

Системата не може да изпълни операцията сега. Опитайте отново по-късно.

Статии 1–20

Позовавания годишно

Дублирани описания

Обединени библиографски описания

Добавяне на съавториСъавтори

Следене

Позовавания

Съавтори