方远虽然火起来了,但是他还没有“飘”起来。
以他现在的水平来说,在本科生中可以说是出类拔萃的了!
特别是他有着其他本科生没有的实践经历。
但是相比那些真正的牛人来说,他的实力还是不够看的。
但是年级才是他最大的资本,在今后的几年时间里都会是他飞速进步的时期。
这个时期可能就是玄幻小说里面说的厚积薄发的时期。
前面十几年时间积累的底蕴,将会让他在这段时间内得到最大的进步。
和别人不一样的是,方远在释放潜力的同时,在系统的帮助下加强自己的潜力。
通俗点说,方远飞速进步的持续时间要比其他人更长一些。
也就是说方远能在这条路上走的更远,变得更强。
翻译软件其他方面都很好解决,方远毕竟有编写qoqo的经验。
但是有一点并不是很好解决的,那就是语言数据库和词库的建立。
为什么要建立这两个东西呢?
那就要从现在市面上翻译软件的弊端说起了。
现有的翻译软件只能对我们输入的文字或语音进行直译,也就是说它们不会根据语境进行翻译。
特别是语音方面,现有的技术对于一些方言的识别率着实让人头疼。
但是方远要做的这款软件可以完美的解决这个问题。
关键就是上面说的两个数据库的建立。
不仅仅要建立这两个数据库,还需要对二者进行关联操作。
除了这两个数据库之外,还有一个匹配库需要方远来完成。
这里面的关系十分复杂。
这款智能翻译软件,首先通过匹配库,对你当前的使用场景(默认为最常使用的场景)进行识别。
然后通过语言数据库中的资料对你输入的文字或者语音进行拆分。
用拆分出来的各个小单元在在词库中进行匹配。
并且按照翻译后语言的语法规则进行重新排序。
并且在语音输入方面进行了一定的优化处理,可以通过语言库中的数据,对方言进行良好的识别。
说来说去,最重要的就是语言库的建立。
这方面系统也为方远想好了办法,就是通过爬虫的办法,通过对短视频网站、直播网站、自媒体网站等进行数据获取。
当然这个过程并不是短时间内可以完成的。
而且对计算机配置的要求非常高,方远现在用的x星人电脑根本就支持不了这个软件的需求。
好在上次去“九州”公司的时候,他听到刘志军说道公司目前还有几台服务器暂时是空余的!
这也省了方远很大的功夫。
拿起电话,向刘志军说明情况后,这几台服务器的使用权就暂时交给了方远。
实际上,对于汉语的翻译是所有翻译软件头疼的事情。
经过五千年历史的沉淀,汉语的语意是所有语言中最复杂的情况。
特别是现在非常火的东北话,里面有很多词的对应词库是非常难以建立的。
这里就不得不感慨系统的厉害之处了!
在整段程序中,语意匹配算法是方远最喜欢的地方。
这里通过一个数学模型,建立文字和语意匹配模型。
所有字都相当于一个模型,一句话中有多少个文字,就相当于多少个模型相连接。
&nb... -->>
本章未完,点击下一页继续阅读