Home Catalogue search

eng

Refine your search:

Search in the Catalogues and Directories






	Sort by
Simple Search

Hits 1 – 10 of 10

1	DeepNet: Scaling Transformers to 1,000 Layers ...
	Wang, Hongyu; Ma, Shuming; Dong, Li. - : arXiv, 2022
	BASE
	Show details

2	On the Representation Collapse of Sparse Mixture of Experts ...
	Chi, Zewen; Dong, Li; Huang, Shaohan. - : arXiv, 2022
	BASE
	Show details

3	Allocating Large Vocabulary Capacity for Cross-lingual Language Model Pre-training ...
	Zheng, Bo; Dong, Li; Huang, Shaohan. - : arXiv, 2021
	BASE
	Show details

4	Improving Pretrained Cross-Lingual Language Models via Self-Labeled Word Alignment ...
	Chi, Zewen; Dong, Li; Zheng, Bo. - : arXiv, 2021
	BASE
	Show details

5	Multilingual Machine Translation Systems from Microsoft for WMT21 Shared Task ...
	Yang, Jian; Ma, Shuming; Huang, Haoyang. - : arXiv, 2021
	BASE
	Show details

6	DeltaLM: Encoder-Decoder Pre-training for Language Generation and Translation by Augmenting Pretrained Multilingual Encoders ...
	Ma, Shuming; Dong, Li; Huang, Shaohan. - : arXiv, 2021
	BASE
	Show details

7	XLM-E: Cross-lingual Language Model Pre-training via ELECTRA ...
	Chi, Zewen; Huang, Shaohan; Dong, Li. - : arXiv, 2021
	BASE
	Show details

8	Adapt-and-Distill: Developing Small, Fast and Effective Pretrained Language Models for Domains ...
	The Joint Conference of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing 2021; Dong, Li; Huang, Shaohan. - : Underline Science Inc., 2021
	BASE
	Show details

9	MiniLMv2: Multi-Head Self-Attention Relation Distillation for Compressing Pretrained Transformers ...
	Wang, Wenhui; Bao, Hangbo; Huang, Shaohan. - : arXiv, 2020
	BASE
	Show details

10	Text Morphing ...
	Huang, Shaohan; Wu, Yu; Wei, Furu. - : arXiv, 2018
	BASE
	Show details

© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern