Number of headwords / entries: 1,688,906 / 1,688,906.
Автор: shrekello В списке свыше полутора миллиона английских слов. Он составлен по данным десяти других списков. Для каждого слова дано число исходных списков, в которые оно включено. Источник: http://www.keithv.com/software/wlist/ Ten resulting word lists were compiled by taking words that appeared in the intersection of ten major source word lists. The following source word lists were used: * British national corpus
* American national corpus
* Gigaword newswire corpus (top 400K words)
* LM-CSR newswire corpus (top 400K words)
* Google corpus (top 400K words)
* Enron email corpus
* Wikipedia
* Moby word list
* CMU pronuciation dictionary
* 20 newsgroup corpus This resulted in the following word lists of different size and "quality": Words in 10 lists (22K words)
Words in 9 lists (43K words)
Words in 8 lists (66K words)
Words in 7 lists (91K words)
Words in 6 lists (122K words)
Words in 5 lists (163K words)
Words in 4 lists (219K words)
Words in 3 lists (314K words)
Words in 2 lists (532K words)
Words in 1 list (1699K words) The large English word list includes words from all of the above. В архиве, кроме скомпилированных LSD файлов словаря (для Lingvo x5), находятся исходные файлы (*.dsl, *.ann, *.bmp), которые можно подключить к GoldenDict или использовать для компиляции в более ранних версиях Lingvo.
Автор: shrekello В списке свыше полутора миллиона английских слов. Он составлен по данным десяти других списков. Для каждого слова дано число исходных списков, в которые оно включено. Источник: http://www.keithv.com/software/wlist/ Ten resulting word lists were compiled by taking words that appeared in the intersection of ten major source word lists. The following source word lists were used: * British national corpus
* American national corpus
* Gigaword newswire corpus (top 400K words)
* LM-CSR newswire corpus (top 400K words)
* Google corpus (top 400K words)
* Enron email corpus
* Wikipedia
* Moby word list
* CMU pronuciation dictionary
* 20 newsgroup corpus This resulted in the following word lists of different size and "quality": Words in 10 lists (22K words)
Words in 9 lists (43K words)
Words in 8 lists (66K words)
Words in 7 lists (91K words)
Words in 6 lists (122K words)
Words in 5 lists (163K words)
Words in 4 lists (219K words)
Words in 3 lists (314K words)
Words in 2 lists (532K words)
Words in 1 list (1699K words) The large English word list includes words from all of the above. В архиве, кроме скомпилированных LSD файлов словаря (для Lingvo x5), находятся исходные файлы (*.dsl, *.ann, *.bmp), которые можно подключить к GoldenDict или использовать для компиляции в более ранних версиях Lingvo.