翻译世界

您所在的位置: 首页» 翻译世界» 翻译技术

翻译中的搜索

       网络搜索是翻译技术的一个重要方面,对翻译实践中遇到的专业领域文件及术语翻译有很好的辅助作用,不仅有助于解决翻译中因缺乏相关学科知识而造成的难题,也有助于提高翻译质量及翻译效率。在目前的主流搜索引擎Google和百度中,由于搜索语法的差异,搜索的结果也因所用搜索引擎的不同也有一定的区别。同时,网络资源异常丰富,收集最有效的网络资源也对翻译实践有极好的辅助作用。
  

Ⅰ对搜索的认识
1.1常用搜索引擎分类
网络搜索是翻译技术的一个重要方面,对翻译实践中遇到的专业领域文件及术语翻译有很好的辅助作用,不仅有助于解决翻译中因缺乏相关学科知识而造成的难题,也有助于提高翻译质量及翻译效率。目前常用的搜索引擎主要分为三大类:垂直搜索引擎,全文索引搜索引擎,目录索引搜索引擎以及元搜索引擎。
垂直搜索引擎是某一个行搜索引擎是搜索引擎的分和延伸,如dadasou;全文索引搜索引擎是从互网提取各个网站的信息以网文字),建立起数据并能索与用条件相匹配的按一定的排列序返回果,如Google,百度;元搜索引擎是在接受用求后在多个搜索引擎上搜索并将果返回户,如InfoSpaceDogpileVivisimo、搜星;目录索引搜索引擎格意上不能称真正的搜索引擎只是按目分类的网站接列表而已。用完全可以按照分类目找到所需要的信息不依靠键词Keywords。如Yahoo,新浪等。
1.2常用的搜索引擎的主要功能:
1.2.1抓取网
每个独立的搜索引擎都有自己的网抓取程序spiderSpider着网中的超连续地抓取网
1.2.2处理网页
搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中最重要的就是提取关键词,建立索引文件。
1.2.3提供检索服务
用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页。
1.3对搜索引擎的认识
笔者首次接触搜索引擎,是在1999年。当时主要是搜狐,属于目录式搜索引擎。对于搜索某一类别的资料非常有帮助。如教育、游戏、音乐、明星等。所给列表能清晰显示最权威或最顶级的网站。类似的引擎还有雅虎。后来,搜狐转做门户网站,笔者使用搜狐搜索的频率也大为降低。
跨入新千年后,“众里寻他千百度”,百度,成为使用最广泛的专业搜索引擎。同时,搜索英文网页时,一般使用Google。另外,四五年前,听读研的同学(英语专业)说,搜索学术文章一般都用Google。还有专门的scholar学术版。
除了搜索引擎,便是各种网络数据库。使用最多的便是中国知网。
总的来说,笔者对于搜索引擎并不陌生,对于搜索语法也早有认识,但是因为专业的搜索使用不多,因此对于语法没有深入钻研,通过本学期的课,有了更全面更深入的认识,今后一定结合翻译实践提高“搜商”,熟练使用搜索语法。
 
Ⅱ搜索语法与差异
2.1 Google的搜索语法
一般搜索引擎需要在多个关键字之间加上“ + ”,而 GOOGLE 无需用明文的“ + ”来表示逻辑“与”操作,只要空格就可以了。GOOGLE 用减号“ - ”表示逻辑“非”操作。GOOGLE 用大写的“ OR ”表示逻辑“或”操作。混合查询涉及到逻辑操作符的顺序问题。一般而言,搜索引擎按照从左往右的顺序读取操作符号。如果只涉及“与”操作和“非”操作,则不会产生顺序问题,搜索结果数量和关键字顺序无关,不过,具体搜索的结果顺序会视关键字的顺序而定。单纯的“或”操作也同样道理。通常情况下,用一个关键字查询,会得到很多和查询目的不相关的冗余信息。
我们总是希望,搜索结果的第一个条目中就包含所需要的信息。“ + ”和“ - ”很多时候就起到缩小搜索结果的范围,以提高查询结果命中率。很多搜索引擎支持通配符号,如“ * ”代表一连串字符,“ ? ”代表单个字符等。 GOOGLE 不支持通配符,只能做精确查询,关键字中的“ * ”或者“ ? ”会被忽略掉。GOOGLE 对英文字符大小写不敏感,“ GOD ”和“ god ”搜索的结果是一样的。GOOGLE 的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。GOOGLE 对一些网路上出现频率极高的英文单词,如“ i ”、“ com ”、“ www ”等,以及一些符号如“ * ”、“ . ”等,作忽略处理。
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“ + ”号。“ site ”表示搜索结果局限于某个具体网站或者网站频道,如“ sina.com.cn ”、“ edu.sina.com.cn ”,或者是某个域名,如“ com.cn ”、“ com ”等等。如果是要排除某网站或者域名范围内的页面,只需用“ - 网站 / 域名”。
“ filetype: ”,这是个尚在测试阶段的 GOOGLE 特色查询,不过功能已经非常强大,可以做很多意想不到的事情。最重要的文档搜索是 PDF 搜索。 PDF 是 ADOBE 公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前 GOOGLE 检索的 PDF 文档大约有 2500 万左右。 PDF 文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
“ inurl ”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“ MP3 ”、“ GALLARY ”等,于是,就可以用 INURL 语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。 INURL 语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
“ intitle ”和“ allintitle ”的用法类似于上面的 inurl 和 allinurl ,只是后者对 URL 进行查询,而前者对网页的标题栏进行查询。网页标题,就是 HTML 标记语言 title 中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。
如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。而“ link ”语法就能让你迅速达到这个目的。“ related ”用来搜索结构内容方面相似的网页。“ cache ”用来搜索 GOOGLE 服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。info 用来显示与某链接相关的一系列搜索,提供 cache 、 link 、 related 和完全包含该链接的网页的功能。
GOOGLE 图像搜索目前支持的语法包括“ + ”,“ - ”,“ OR ”,“ site ”和“ filetype ”。 如果不想搜索广泛的网页,而是想寻找某些专题网站,可以访问 GOOGLE 的分类目录“ http://directory.google.com/ ”,中文目录是“ http://directory.google.com/Top/World/Chinese_Simplified/ ”。
新闻组有详尽的分类主题,某些主题还有专人管理和编辑,具有大量的有价值信息。由于新闻组包含的信息实在是海量,因此不利用工具进行检索是不大可能的。 DEJA 一直是新闻组搜索引擎中的佼佼者。 2001 年 2 月份, GOOGLE 将 DEJA 收购并提供了所有 DEJA 的功能。现在,除了搜索之外, GOOGLE 还支持新闻组的 WEB 方式浏览和张贴功能。
进入 GOOGLE 新闻组“ http://groups.google.com/ ”,你有两种信息查找方式。一种是一层层的点击进入特定主题讨论组,另一种则是直接搜索。
2.1百度与Google因搜索语法不同所造成的差异
在强制搜索语法上,两者在双引号及中文书名号的上已经达到了统一,只有“+”的差异,百度不支持而Google支持。
在link语法中,Google支持而百度不支持。在Filetype语法中,百度支持6种非HTML 的搜索而Google支持18种。在实际使用中,Google要求语法表达式的书写十分规范,语法命令词必须要全部小写,否则就会出现错误性提示;命令词后的冒号要紧跟命令词,两者之间不得留有空格,且输入的冒号必须是英文半角形式;冒号与后面的跟随部分之间也不得有空格,然而,使用百度的高级搜索语法就显得轻松自如而随意了。
通过比较分析百度和Google的搜索语法,不难发现两者之间虽然存在着差异,但更多的是有很多共同点。
 
Ⅲ翻译与搜索
3.1网络搜索对翻译效率的提升作用
在日常翻译实践中,我们往往会遇到不同学科领域的文件资料,对此我们不可能门门精通,这就导致无法理解资料含义而影响翻译质量,甚至直接影响翻译的进行。在这种情况,查找资料就必不可少。相对于传统的图书馆等纸质资料的借阅查找,网络搜索非常便捷,可以节省我们大量的时间。
同时,在进行网络搜索时,熟练地掌握搜索语法更是有助于我们快速准确地定位到所需的信息,可以极大的提高我们的翻译效率。下面我们将举例说明。
3.2网络搜索对某个不确定词语或句子的验证过程(附图)
如对于“扣率”一词的搜索。
我们先Google一下。(附图1)
在结果中,我们看到了百度百科的解释,得知该词属于经济类词汇,但是没有该词的英文表达。那么我们尝试着找一些经济类的专业网站。经搜索,我们找到了中国经济网www.ce.cn(附图2)。然后我们用“扣率 site:www.ce.cn”来进行进一步搜索。遗憾的是,该网站主要语言为英文,因此并未找到该词的英文说法(附图3)。我们转而直接用“扣率英文”作为关键词来Google一下。幸运的是,我们找到了Deduction rate(附图4)。但是,我们不确定这个译法对不对,是不是唯一的译法。因此,我们到英文网站中验证一下。我们输入“deduction rate site:nytimes”搜索但是没有搜到。,我们输入全称“deduction rate site:www.nytimes.com”,搜索结果见附图5。800多条不算太多,再换个经济类网站试试。在Businessweek的网站上又搜到了300多条(附图6),看来这个词不算很常见。
附图1
\

附图2
 \
附图3
  \
附图4
 \
附图5
 \
附图6
 \

 
结语
本文主要讨论网络搜索的特点及其语法,着重讨论高级搜索语法的重要作用及其对翻译实践效率的提高作用。搜索引擎是一个非常庞杂的领域,非常值得我们去探索学习。翻译工作者应该首先掌握搜索引擎的基本知识并熟练运用,这样才能在翻译实践中如虎添翼,事半功倍。
 
参考资料
“百度与Google搜索语法比较分析” 《情报搜索》2009(10)