Я хотел использовать конечную точку «определения языка» когнитивной службы переводчика Azure, но мне это кажется неработающим. Я отправил запрос на https://api.cognitive.microsofttranslator.com/detect?api-version=3.0
в следующем тексте:
[
{"Text":"aoishdioashdoiashdioa"}
]
Ответ такой:
[
{
"language": "en",
"score": 1.0,
"isTranslationSupported": true,
"isTransliterationSupported": false,
"alternatives": [
{
"language": "de",
"score": 1.0,
"isTranslationSupported": true,
"isTransliterationSupported": false
},
{
"language": "fr",
"score": 1.0,
"isTranslationSupported": true,
"isTransliterationSupported": false
}
]
}
]
Мне интересно, как я могу получить такой высокий балл уверенности в 1.0 с моим дерьмовым вводом. Кто-нибудь знает, что мне не хватает?
Похоже, вы стараетесь правильно. — person Klemens Morbe schedule 24.04.2020
Есть нейронная система для microsoft-переводчика, поэтому объяснить, почему возникает такая ситуация, непросто.
Однако, если вы настаиваете на объяснении, вот возможная причина. Если это недействительный текст, он проанализирует то, что в нем есть. Как и в вашем тексте, все буквы написаны латиницей. И на многих языках все они содержат эти буквы, предположим, поэтому все баллы равны 1.0.
А затем о том, почему он перечисляет эти языки, потому что не во всех языках есть одинаковые буквы, как в некоторых, например, _1 _, _ 2_, предположим, что он проанализирует вероятность этих букв, а затем получит список языков с наивысшей вероятностью.