В статье предлагается метод исследования близости языков, основанный на применении информационных технологий и прикладных математических методов в языкознании. После обработки большого массива протранскрибированных текстов на компьютере была вычислена схожесть лингвистических объектов с помощью методов математической статистики и распознавания образов. Анализируется типология строения звуковых цепочек в языках и их диалектах в качестве образа. На основании доминантных фонетических признаков звуковых картин построены фонотипологические расстояния между лингвистическими объектами.
The article investigates the phono-typological closeness of linguistic objects by the Chi-square criterion. Any dialect or language is considered to be a linguistic object. The Chi-square distance is based on the typology of the structure of the speech sound chains in languages and dialects. The total of the speech sound chains comprise a phonetic picture of a language. The typological distances on the phonetic level between the linguistic objects have been built on the basis of threshold value of the TMB coefficient which is the ratio of the computed Chi-square value in a text to the theoretical value of the Chi-square criterion with respect to the degrees of freedom and the level of statistical significance. It allows us to classify the linguistic object either as a dialect or as a separate language from the point of view of their phonetic pictures.