A szókincs nagyságának meghatározása régóta izgatja a laikusokat és a nyelvészeket egyaránt. „A problémát elméleti és gyakorlati nehézségek miatt tökéletesen megoldani nem lehet” – állapítja meg Fábián Pál. Az egyik, tisztán elméleti kérdés, hogy mit tekinthetünk szókészlettani egységnek, vagyis mi számít külön szónak, mi nem. A másik kérdéskör, hogy az abszolút magyar szókészletet kívánjuk-e összegyűjteni, tehát minden, a magyar nyelvtörténet folyamán vagy a különböző réteg-, illetőleg szaknyelvekben valaha is létező szót, avagy csak a mai magyar köznyelvben élő közszavakat vegyük figyelembe. A harmadik, lényegében gyakorlati kérdés: a fentiek eldöntése után hogyan gyűjtsük össze, tároljuk és számoljuk meg a számba veendő szavakat.
Nyelvészeti szakirodalmunkban meglehetősen eltérő véleményeket olvashatunk a magyar szókincs nagyságáról, illetőleg arról, hogyan, milyen módszerekkel lehet ezt megállapítani. Kelemen József szerint „a valóban használt szavak száma határozószók és igenevek nélkül 800 000-re, azokkal együtt 1 065 000-re tehető”. Lényegében az utolsó ötven évben ez az adat, amely szerint körülbelül egymillióra becsülhető a magyar szavak száma, tankönyveinkben és a műveltebb laikusok tudatában él. A mai magyar nyelv című egyetemi tankönyv is gyakorlatilag Kelemen adatait közli.
Az utóbbi évtizedben viszont teret kapott az a vélemény, mely szerint a körülbelül egymilliónál jóval nagyobb a magyar szavak száma. Ha a neveket nem tekintjük a szókészlet önálló elemeinek, akkor mit kezdünk a belőlük szabályosan képzett, viszonylag sűrűn használt melléknevekkel? Ez bizony áthidalhatatlan ellentmondásnak tűnik. Hasonló a helyzet más tulajdonnévcsoportok esetében is. Például a családnevek nagy része köznyelvi eredetű ugyan, de közülük sok tulajdonnévként eltérő írásképű, s csak a magyar eredetű családneveket (Dessewffy), illetőleg a magyarok által viselteket (Zrínyi) figyelembe véve is meglehetősen nagy név-, azaz szóanyaggal számolhatunk.