Frederik Kunstner

Cited by

	All	Since 2019
Citations	457	451
h-index	7	7
i10-index	6	6

140

105

20182019202020212022202320243 18 51 100 98 129 54

Public access

View all

4 articles

0 articles

available

not available

Based on funding mandates

Co-authors

Mark SchmidtAssociate Professor of Computer Science, University of British ColumbiaVerified email at cs.ubc.ca
Philipp HennigUniversity of TübingenVerified email at uni-tuebingen.de
Lukas BallesAleph AlphaVerified email at aleph-alpha.com
Simon Lacoste-JulienAssociate Professor - Canada CIFAR AI Chair, University of Montreal / MilaVerified email at iro.umontreal.ca
Felix DangelPostdoc at the Vector Institute, TorontoVerified email at vectorinstitute.ai
Sharan VaswaniSimon Fraser UniversityVerified email at sfu.ca
Issam H. LaradjiStaff Research Scientist at ServiceNow & Adjunct Professor at University of British ColumbiaVerified email at servicenow.com
Aaron MishkinPhD Student, Stanford UniversityVerified email at cs.stanford.edu
Didrik NielsenPhD Student, Technical University of DenmarkVerified email at dtu.dk
Mohammad Emtiyaz KhanCenter for Advanced Intelligence Project (AIP), RIKEN, TokyoVerified email at postman.riken.jp
Jonathan Wilder LavingtonPhD Student, University of British ColumbiaVerified email at cs.ubc.ca
Raunak KumarCornell UniversityVerified email at cornell.edu
Si Yi MengCornell UniversityVerified email at cs.cornell.edu
Victor Sanches PortellaPhD candidate in Comptuer Science, University of British ColumbiaVerified email at cs.ubc.ca
Nicholas J. A. HarveyProfessor of Computer Science, University of British ColumbiaVerified email at cs.ubc.ca
Alberto BiettiFlatiron Institute, Simons FoundationVerified email at nyu.edu
Rémi Le PriolPhD from MILA, University of MontréalVerified email at umontreal.ca
Damien ScieurSamsung - SAIL MontréalVerified email at samsung.com
Robert Mansel GowerResearch Scientist, Center for Computational Mathematics, Flatiron Institute, Simons FoundationVerified email at flatironinstitute.org
Martin JaggiEPFLVerified email at epfl.ch

Frederik Kunstner

University of British Columbia

Verified email at cs.ubc.ca - Homepage


Title Sort by citations Sort by year Sort by title	Cited by Cited by	Year
Limitations of the empirical Fisher approximation for natural gradient descent F Kunstner, L Balles, P Hennig Advances in Neural Information Processing Systems 32, 4158--4169, 2019	186	2019
BackPACK: Packing more into Backprop F Dangel, F Kunstner, P Hennig International Conference on Learning Representations, 2020	101	2020
Slang: Fast structured covariance approximations for bayesian deep learning with natural gradient A Mishkin, F Kunstner, D Nielsen, M Schmidt, ME Khan Advances in Neural Information Processing Systems 31, 6248--6258, 2018	67	2018
Adaptive gradient methods converge faster with over-parameterization (but you should do a line-search) S Vaswani, I Laradji, F Kunstner, SY Meng, M Schmidt, S Lacoste-Julien arXiv preprint arXiv:2006.06835, 2020	34*	2020
Noise is not the main factor behind the gap between sgd and adam on transformers, but sign descent might be F Kunstner, J Chen, JW Lavington, M Schmidt International Conference on Learning Representations, 5, 2023	32*	2023
Homeomorphic-Invariance of EM: Non-Asymptotic Convergence in KL Divergence for Exponential Families via Mirror Descent F Kunstner, R Kumar, M Schmidt International Conference on Artificial Intelligence and Statistics 130, 3295 …, 2021	26	2021
Fully Quantized Distributed Gradient Descent F Künstner, SU Stich, M Jaggi Technical report, EPFL, 2017	8	2017
Searching for optimal per-coordinate step-sizes with multidimensional backtracking F Kunstner, V Sanches Portella, M Schmidt, N Harvey Advances in Neural Information Processing Systems 36, 2024	2	2024
Convergence Rates for the MAP of an Exponential Family and Stochastic Mirror Descent--an Open Problem RL Priol, F Kunstner, D Scieur, S Lacoste-Julien arXiv preprint arXiv:2111.06826, 2021	1	2021
Heavy-Tailed Class Imbalance and Why Adam Outperforms Gradient Descent on Language Models F Kunstner, R Yadav, A Milligan, M Schmidt, A Bietti arXiv preprint arXiv:2402.19449, 2024		2024
Variance Reduced Model Based Methods: New rates and adaptive step sizes RM Gower, F Kunstner, M Schmidt OPT 2023: Optimization for Machine Learning, 2023		2023

The system can't perform the operation now. Try again later.

Articles 1–11

Citations per year

Duplicate citations

Merged citations

Add co-authorsCo-authors

Follow

Cited by

Co-authors