免费阅读
返回
菜单
上一章查看最新章节下一章

第60章 给词语一个向量

作品:学霸的黑科技时代作者:咬文嚼纸
如果本章错误,请点击报错10秒纠正

里就是程序的具体书写。

萧铭英语词汇量不足,但是语法没有问题。

萧铭归纳,现今市面上的翻译软件和翻译机最大的缺陷有两个。

一个是词不达意。无论是英语还是汉语,通常会有多种意思,在不同的语境中有不同的解释,但是机器翻译并不能完全了解人类表达的意思。很多时候单词的词语意思准确,但是放在句子中笑话百出。

还一个是无法识别人类的语音。这主要出现在翻译机上,每个人有很多种口音,生活中的对话有很多的俚语,人和人之间对话时绝对不可能像央视主播那样每句话都是语言要素齐全,语音标准。

机器翻译在很多时候都会捡着听得懂的翻译,听不懂的乱翻译。这也是很多品牌的翻译机拿到国外去应用的时候让顾客感到并不顺心,翻译机更不能作为会议同声翻译的原因。

为了处理上面两个主要问题,萧铭按照说明书的建议项,编辑着。

萧铭采用数学的思维,将每个词语设定为向量,并且分类为名词、动词等等。

将词语设定为向量的好处就是讲长难句进行肢解,翻译软件处理时会将每个词语准确的翻译。

接下来就是按照语言的语境筛选组合,将不同的词语按照翻译对象需要的语法和含义进行组合,并对缺少的语法要素进行补足。

在盘古编程语言的提示下,萧铭知道自己编程的逻辑是正确的。

但是逻辑正确只是第一步,怎么让拥有向量的词语按照语法组合为新的语句,这个很难,这也是现代翻译软件和机器最大的难点。

没有关系,这是盘古最擅长的。

盘古给了萧铭几个接入入了口。

萧铭将导入大量的中英文资料,资料不仅有名著更有口水话表达的网路小说、贴吧问答、微博、推特文章等等。

未来这些资料会可以由用户们自己上传,优化程序的准确性。

盘古的数据库能将整合这些资料,熟悉每一个句子的语境,然后整理出数据模型(模拟出汉语和英语等人类思维表达方式的模型)。

这些数据会帮助“词向量”在不同的语境和语法中出现在合适的位置,如此翻译会更加准确。

这项工作最大的难点就是编译量非常大!

所以现今市面上现存的翻译软件都是采用语言学家总结的语法库,即便有少部分软件有自我学习功能,也不能做到了解和统计当今所有的语言习惯并对其作出分析。这也

…。。
   本章没完,请点击下—页继续阅读!如果被转码了请退出转码或者更换浏揽器即可。
  温馨提示:亲爱的读者,如果你觉得本站还好,为了避免丢失和转马,请勿依赖搜索访问,建议你使用[华为刘揽器]或[Firefox火狐刘揽器]访问并收蔵【无极书院】 m.wjzxchina.com。我们将会持续为你更新,还建议你注册会员使用书架功能追书阅读更方便。
上一页 123下一页
上一章查看最新章节下一章
临时书架加入书签回顶部↑

看了《学霸的黑科技时代》的书友还喜欢看

重生在星际选择成为药剂师
作者:长尾兔子
简介: 陈房子年纪轻轻便猝死了,死前啥都没有,没有房子没有存款没有恋人,浑身散发着满满的社畜...
更新时间:2026-03-03 23:39:08
最新章节:732 反正早上已经看过了,再洗洗也无所谓了
阴影帝国
作者:三脚架
简介: 站着死还是跪着生从来都不是一个问题,不愿意跪着的早就站了起来,不敢站起来的一直跪着,...
更新时间:2026-03-03 23:16:08
最新章节:第1358章 世纪之战
正的发邪:全宗跪求大师兄娶魔女
作者:默默地抽根烟
简介: 【无系统】【无敌】【剑道】【大师兄】\n神剑宗大师兄张青锋,九年前惨遭魔女暗算,痛失...
更新时间:2026-03-03 23:43:23
最新章节:第436章 多谢指教
我在俄国当文豪
作者:卡拉马佐夫
简介: 多年以后,当纳博科夫在美国讲授俄国文学的时候。他是如此这般操作的。

更新时间:2026-03-03 23:40:00
最新章节:408、加利福尼亚见闻和关于淘金者的小说
命格大器晚成?可我是天才啊!
作者:上班为了辞职
简介: 【天才流、爽文、谨慎、半苟、偏慢热、评分低跟字数有关】\n......\n【命主:江...
更新时间:2026-03-03 23:40:35
最新章节:第326章 双手染血
我在诡异世界谨慎修仙
作者:九上签
简介: 资源匮乏,妖邪遍地,陈林穿越到了一个诡异的世界之中。原本应该高高在上的修仙者,在这里...
更新时间:2026-03-03 23:15:10
最新章节:第二千三百五十一章 普达
书名:

本站若有图片广告属于第三方接入,非本站所为,广告内容与本站无关,不代表本站立场,请谨慎阅读。

Copyright © 2020 无极书院 All Rights Reserved.kk

SiteMap