
уÑловиÑÑ… раÑтущего Ñетевого мира доÑтупноÑть выÑококачеÑтвенных переводов имеет решающее значение Ð´Ð»Ñ ÑƒÑпеха в уÑловиÑÑ… раÑтущей международной конкуренции. МаÑÑовые компании по вÑему миру, а также компании Ñреднего размера обÑзаны предоÑтавлÑть Ñвоим клиентам качеÑтвенную техничеÑкую документацию Ñ Ñ…Ð¾Ñ€Ð¾ÑˆÐ¸Ð¼ переводом не только Ð´Ð»Ñ Ñ‚Ð¾Ð³Ð¾, чтобы добитьÑÑ ÑƒÑпеха на рынке, но и Ð´Ð»Ñ ÑÐ¾Ð±Ð»ÑŽÐ´ÐµÐ½Ð¸Ñ Ð¿Ñ€Ð°Ð²Ð¾Ð²Ñ‹Ñ… норм и Ð¸Ð·Ð±ÐµÐ¶Ð°Ð½Ð¸Ñ Ñудебных иÑков. Таким образом, Ñтот Ñ‚ÐµÐ·Ð¸Ñ Ð¿Ð¾ÑвÑщен оценке качеÑтва перевода, в чаÑтноÑти техничеÑкой документации, и отвечает на два оÑновных вопроÑа: Как раÑÑчитать качеÑтво перевода техничеÑких документов, еÑли имеетÑÑ Ð¾Ñ€Ð¸Ð³Ð¸Ð½Ð°Ð»ÑŒÐ½Ñ‹Ð¹ документ? Как можно оценить качеÑтво перевода техничеÑких документов, еÑли иÑходный документ недоÑтупен? Ð”Ð»Ñ Ð¾Ñ‚Ð²ÐµÑ‚Ð° на Ñти вопроÑÑ‹ иÑпользуютÑÑ Ñамые Ñовременные алгоритмы машинного Ð¾Ð±ÑƒÑ‡ÐµÐ½Ð¸Ñ Ð¸ метрики оценки перевода в контекÑте процеÑÑа Ð¾Ð±Ð½Ð°Ñ€ÑƒÐ¶ÐµÐ½Ð¸Ñ Ð·Ð½Ð°Ð½Ð¸Ð¹. Оценки выполнÑÑŽÑ‚ÑÑ Ð½Ð° уровне предложений и рекомбинируютÑÑ Ð½Ð° уровне документов путем двоичной клаÑÑификации предложений как компьютерного перевода и Ñпециализированного перевода. ИÑÑледование оÑновано на базе данных, включающей 22 327 предложений и 32 атрибута оценки перевода, которые иÑпользуютÑÑ Ð´Ð»Ñ Ð¾Ð¿Ñ‚Ð¸Ð¼Ð¸Ð·Ð°Ñ†Ð¸Ð¸ пÑти различных подходов машинного обучениÑ. Метод оптимизации, ÑоÑтоÑщий из 795 000 оценок, показывает точноÑть раÑчета до 72,24% Ð´Ð»Ñ Ð´Ð²Ð¾Ð¸Ñ‡Ð½Ð¾Ð¹ клаÑÑификации. Ðа оÑнове уÑтановленных ÑиÑтем клаÑÑификации на оÑнове предложений документы клаÑÑифицируютÑÑ Ñ Ð¸Ñпользованием рекомбинации ÑвÑзанных предложений, и уÑтанавливаетÑÑ Ñ„Ð¾Ð½ Ð´Ð»Ñ Ð¾Ñ†ÐµÐ½ÐºÐ¸ качеÑтва документов. Следовательно, принÑтый подход абÑолютно Ñоздает подход категоризации и оценки.
In the context of an increasingly networked world, the availability of highquality translations is critical for success in the context of the growing international competition. Massive worldwide companies as well as medium sized companies are required to provide well translated, high quality technical documentation for their customers not only to be successful in the market but also to meet legal regulations and to avoid lawsuits. Therefore, this thesis focuses on the evaluation of translation quality, specifically regarding technical documents, and answers two central questions: How can the translation quality of technical documents be calculated, given the original document is available? How can the translation quality of technical documents be assessed, given the original document is not available? These questions are answered using state-of-the-art machine learning algorithms and translation evaluation metrics in the context of a knowledge discovery process. The evaluations are done on a sentence level and recombined on a document level by binarily categorizing sentences as computerized translation and specialized translation. The research is based on a database including 22,327 sentences and 32 translation evaluation attributes, which are used for optimizations of five different machine learning approaches. An optimization method consisting of 795,000 evaluations shows a calculation accuracy of up to 72.24% for the binary classification. Based on the established sentence-based classification systems, documents are classified using recombination of the affiliated sentences and a background for rating document quality is established. Therefore, the taken approach absolutely creates a Ñategorization and assessment approach.
word error rates, маÑиннÑй пеÑевод, извлеÑение даннÑÑ, коÑÑÑиÑÐ¸ÐµÐ½Ñ Ð¾Ñибок в ÑловаÑ, RapidMiner, data mining, иÑкÑÑÑÑÐ²ÐµÐ½Ð½Ð°Ñ Ð½ÐµÐ¹ÑÐ¾Ð½Ð½Ð°Ñ ÑеÑÑ, artificial neural network, machine translation
word error rates, маÑиннÑй пеÑевод, извлеÑение даннÑÑ, коÑÑÑиÑÐ¸ÐµÐ½Ñ Ð¾Ñибок в ÑловаÑ, RapidMiner, data mining, иÑкÑÑÑÑÐ²ÐµÐ½Ð½Ð°Ñ Ð½ÐµÐ¹ÑÐ¾Ð½Ð½Ð°Ñ ÑеÑÑ, artificial neural network, machine translation
| citations This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
