写这样一个搜索主题的教程,完全出于网友的「怂恿」。他们通过微信、邮件等各种我在虫
部落留下的联系方式表达了自己对于虫部落五年来所做
服务的认可和期望。其中就有很多对于将搜索技能的提升和搜索经验的积累和我原创设计的
各种生动有趣的题目结合起来的这种形式的喜闻乐见。下面截取了几封邮件的信尾内容:
后来...... 如你所见。虽然本电子书教程和虫部落邀请码作为套餐预售的提前量长达一年,但
实际写的过程,零零碎碎用了两三个月时间吧。除了上班、找对象这些苦差事,我还和朋友
外包了一个项目。相信很多人都留意到我回邮件和发公众号推文都是在凌晨了,再加之五月
份踢球时韧带撕裂...... 哎! 越到后面就越像一块沉重的石头,被现实的洪流裹挟着翻滚、前
进。电子书的上线也算一丢丢如释重负吧。
外包的项目收工了,上帝开眼也给赏赐了个女朋友,膝盖的伤也在慢慢恢复...... 我打算八月
份回老家一段时间,陪陪家长。大概会是一段高产如母猪的时期 —— 对于这本电子书的更
新而言 �
作为第一次系统性的创作尝试,我给这门教程设定了三个内容指标。
简单来说就是有案例!生动有趣的原创案例和练手题目。
干货少不了!老生常谈的也会纳入梳理,毕竟这是一个系统化教程;新鲜陌生的则可以让你 的搜索方式多样化,此路不通,另辟蹊径。
除了通过记忆能够让你在搜索时更加游刃有余的 tips,我更想在诸多的案例中和各位分享一 些有关搜索方法论的 ideas。这些往往才是能力的体现,需要通过日常自己独立地不断尝试 来提升。 ideas 不是有关搜索细枝末节的各种一招鲜,而是宏观层面的觉悟,比如花费一天时间而搜 索未果时,你是否权衡过时间的沉没成本?这种时间投入有没有可能在你一开始时通过一些 论证来帮助你决策是否值得一试?如此种种,都是我们值得深入思考和总结的部分。 我会时不时地提醒自己:这门教程要尽力去做到化繁为简、拨云见日。我们追求的是良好的 信息素养、高效的搜索习惯;不是花拳绣腿的炫技,不是把通俗的「人话」包装成「不明觉 厉」,不是把有限的生命投入到无限的试错当中。 虽然因为创建虫部落五年来积累了不少知识和经验,对于搜索有自己一些见解,但在互联网 信息洪流的裹挟下,难免也沾染了不少污点,这些污点既是学识的缺憾,也如同黑洞一样洞 穿出自身的肤浅。所以对于教程中的纰漏、错误,我愿和各位一同弥补、修正。让《从零到 百》创造更多的价值。 当然,我还要特别强调:我们所做的一切,都是站在巨人的肩膀上。
回顾历史,你定会发现:所有好的发明、设计、方法论都是致力于让用户可以「傻瓜式」地 使用。计算器、iPhone、微信...... 以及筷子。 据观察,总有一些「非蠢既坏」的人特别热衷于自制各种「机械臂」来操纵筷子,以此教人 如何使用筷子进食...... 不!是教人如何更高级地使用筷子。他们的受众可以笼统称为「 向往长成五颜六色而非绿色的韭菜」。前者投其所好,将简单的事物解构和组装成看起 来更炫酷的新事物,后者耳目一新,一声「牛逼」不成敬意。事实上,其大有「一顿操作猛 如虎,定睛一看原地杵」的意味。 所以,如同吃饭一样,我们对于知识信息的获取,是需要更多筷子这样简单、高效的介质。 剑走偏锋,忘记最简单朴素的初衷,结果往往适得其反。你看看,那些刚学了两天编程就兴 冲冲地写个网页给妹子去示爱的,有没有把妹子感动哭的?� 可惜这样的剧情每年都还在 上演。 回到这门教程,我隔三差五地删了不少节点内容。你放心,我删的不是「机械臂」!而是那 些没有必要深入的内容。那么判断没有必要的依据是什么呢?低频!即是被使用的频率低到 你完全没有必要为其付出一丁点学习成本。 � 长得是很简单, 但学会正确地使用它,对于任何一个小朋友来说都不那么简单。这需要 每个人的练习。所以在这门教程中,我会尽可能多地附上一些问题案例,供各位实践交流。
在流量为王,标题党无处不在的自媒体爆发时期,一些被冠以吸睛标题的文章成为「收藏爱 好者」眼中的干货,但是我们却遗憾地发现文中的信息已经过时,链接已经失效...... 我认为好的理论和经验也需要跟随时间的进程不断被翻新和验证,这样的知识才会保有健壮 的生命力。 所以我在此承诺:本教程在第一版推出后,每个月会更新一次在线内容,每两个月会更新一 次离线版内容,所有的内容更新服务对于已付费的各位姥爷而言都是终身免费。
更新周期 | 维护内容 | 新增内容 |
---|---|---|
1 个月 | 全部的链接和案例 | 2 个案例 + 2 个练手题 |
1 年 | 结合过去的变化,重构教程体系 | 结合收集到的反馈,优化教程体验 |
有一件事情,我在初中的作文竞赛中写过 3 次。时隔多年,我想引用对于彼时作文内容的 模糊记忆,再次陈述这件事情。
那天晚上大概 12 点左右,中央电视台会直播雅典奥运会的开幕式。而我们家那台天线遥 感不良的黑白电视是收看不到 CCTV 的。
可是我很想看。
到了晚上八九点的样子,家长开始忙碌着打饲料,所谓打饲料就是将一袋袋玉米打碎,用 于投喂给后院鸡舍里饲养的两千多只鸡。打饲料是在屋子里进行,每次一打饲料,屋里就粉 尘弥漫。打完之后,在场每个人浑身都披上了白色的玉米粉末,尤其是面部,就像戏剧演员 化了浓妆,眉毛上也挂满了粉,又像白眉大侠。
打饲料的过程噪音特别大,爸妈扛着八九十斤重的袋子上下腾挪,我根本没法上前恳求他 们带我去住在另外一个村的姨夫家去看奥运会开幕式。
终于等到饲料打完了!我上前跟我妈说了我的想法,她没有拒绝!说等她装完了饲料再送 我过去。
等他们忙完已是晚上 11 点多,我妈用毛巾使劲儿拍打走身上的粉末,又洗了把脸,然后 就送我去姨夫家。
那会儿雨还在下,村里的路很泥泞,我妈穿上长长的雨鞋,背起我就走......
两公里的夜路,她把我送到,姨夫一个人睡在桥头的商店里,我们使劲儿拍了好几下才唤 醒了他。我妈只交待了一句转身就消失在夜色中......
我妈其实是很胆小的,那么晚她独自回家,夜雨、蛤蟆叫...... 一定是让她产生了害怕。但 是大概也只有我知道她为什么会尽力满足我的愿望,因为她爱我们姐弟仨儿读书以及一切与 长见识有关的事情,她虽然大字不识几个,但她知道对于新闻获取匮乏的我来说,看一场奥 运会开幕式是可以让孩子长长见识的。
我从她身上总能感受到一些和学识背景反差巨大的智慧。 这件事长存于我的脑海,比童年各种被暴打还要长记性。她总希望我能够多去见识外面更大 的世界,她觉得那样才会更有出息。 就在 4 月底,我带父母逛了乐山大佛、太古里、宽窄巷子...... 在海洋公园,他们看到五颜六 色的海鱼时觉得很不可思议,他们衰老的眼皮又舒展开来,像个好奇宝宝一样盯着。看来, 无论新生抑或衰老,我们对新世界的发现和探索永远都不会停止。 最后,谢谢各位付费姥爷。教程的发布不是终点,而是继续不断更新和完善的起点,每一次 微小的更新,我都会特殊标注并及时与各位分享。也欢迎各位多多不吝赐教。 2019.5.8 夜 于成都 �
经验和技能的积累都是高效搜索所必需的。但我想在开启这些内容之前,特别特别强调「三 个心」—— 细心、耐心和好奇心。 可能有人以为我会像老干部读稿一样来展开一篇「说的对,但无感」的文章了,特别是「干 货控」和「马克党」。不不不!我只针对面向搜索时各位遇到的普遍性问题开出这三剂良 药。 我们习惯将能够迅速领会的知识称为干货。即它会给人造成一种「我懂了,别人可能还不知 道」的心理满足感。但你肯定明白,干货远不足以构成能力的差距,真正的差距是如何运用 知识创造价值。
这本电子书是用 GitBook 写的,我担心文中很多加粗操作 是无用功。因为过往无论是在虫部落社区发帖,还是在公众号推文,我遇到太多那种...... � 那种即便我加大加粗高亮文字「我结婚了!」(仅为举例),还总有人阅后来问「虫子,你 谈恋爱了吗?」 你知道吗?每次遇到这种人,真想哭。网上有个调侃这种现象的词好像叫「选择性失明」
然而对于搜索而言,细心才能成就你敏锐的观察力。凌乱的排序,模糊的文字,甚至稀疏平 常的超链接可能在你的眼里都有可能成为解决问题的非常规突破口。
我们常说,搜索不能太执念,网络只是世界的一部分,还有很多信息没有被寄存到网络中, 即便有也并非都欢迎爬虫。与其为了免费获取,到处发帖求找一本书,不如老实买一本省 心。与此形成鲜明对比的另一个极端,则更不可取。 没有耐心,浮躁。 Google 创始人拉里・佩奇 (Larry Page) 曾这样描述理想的搜索引擎:能够准确理解你的意 图,并返回你所需的确切信息。而现实与理想却总是有着不小的差距。所以当各位在搜索过 程中并不能快速得到满意的结果时,是否会轻易的放弃呢? 哎呀!Google 都搜不到,那就放弃吧。—— 不试试其它搜索引擎和专业数据查询系统 吗? 都翻了两页搜索结果了,啥都没找到 == —— 不试试其它关键词? 找了两个梯子都不好使,MD 上个 Pornhub 咋这么难? —— 为了极致的快感都不多找几 个试试? 多一点耐心,就多了一种可能。
我认为好奇心是驱动一个人不断提升自我的原动力!它不是「害死猫」的好奇心,它不是绯 闻八卦的好奇心,它是...... 就拿搜索来说,平时群里有相关的问题,我一般都会自己去尝试搜一下,即便是同质化的问 题,我也往往能从尝试中收获不同的、意外的知识和启发。我当然不只是为了给这本教程积 累素材才这么孜孜不倦,我甚至觉得旺盛的好奇心可以使人变得年轻
在社交网络中,你总会遇到这样的人:他们盲目自信于个人经验而对事物的新变种表现出「 不就那么回事儿」的一眼看破;他们对路边吸引到妻子的无名花朵露出「不就是朵野花儿 嘛,走走走」的不耐烦;他们欣喜地转发了一篇「18 个牛逼的学术搜索引擎」 ,都不舍得 点开链接去亲自试试。第二天恰逢学妹请教,他们「可把自己牛逼坏了」地丢给学妹「18 个牛逼的学术搜索引擎」...... 半天过去,学妹嘟囔一句:呀!学长!这些网站咋都失效了呢
这样的人以占有为掌握,习惯对自己都陌生的事物呈现出上帝视角的姿态。实际上,拥 有的从未真正拥有,不以为然的全都不知其所以然。这对于求知探索而言,是如同黑洞一般 的存在,吞噬着所有真正促使你接近事物本质的能量。 所以,如果这本教程能够在激发你对于搜索问题的好奇心方面有哪怕一丁点儿的效用,我都 将视其为比任何干货都更有价值的存在。
在 1993 年 9 月之前,万维网完全被手工索引。Berners-Lee(万维网之父) 在瑞士欧洲核 研究组织 CERN 工作期间创建了万维网。于是世界上第一个网站就在 CERN 搭建,而 CERN 则位于法国边境。网站在 1991 年 8 月 6 日上线:
Info.cern.ch 是世界上第一个网站及网站服务器。网站在一台位于 CERN 的 NeXT 计算 机上运作。第一个网页地址是: http://info.cern.ch/hypertext/WWW/TheProject.html,它是万维网计划的讯息收集 中心。  直到 1993 年夏天时,网上还没有搜索引擎,全部由人工维护着大量专门的内容目录。日内 瓦大学的奥斯卡・尼尔斯特拉斯(Oscar Nierstrasz)写了一连串的 Perl 脚本,这些脚本 定期抓取这些页面,并将它们重写为标准格式。这构成了 W3Catalog 的基础, W3Catalog 是网络上第一个原始搜索引擎,于 1993 年 9 月 2 日发布。 JumpStation(由 Jonathon Fletcher 于 1993 年 12 月创建)使用 Web 爬虫查找网页并 构建其索引,并使用 Web 表单作为其查询程序的接口。因此,它是第一个结合 Web 搜索 引擎(爬行,索引和搜索)的三个基本功能的网络信息检索工具。 最早基于爬虫的全文搜索引擎之一是 1994 年推出的 WebCrawler。与其前辈不同,它允许 用户在任何网页中搜索任何单词,这成为后来所有主要搜索引擎的标准。它也是公众广为人 知的搜索引擎。 不久之后,许多搜索引擎出现百家争鸣的态势。其中就包括 Magellan,Excite,Infoseek (李彦宏即是被推荐到这家公司从事搜索技术的开发),Inktomi,Northern Light 和 AltaVista 等等。而那时的 Yahoo! 是人们查找感兴趣的网页的最流行的方式之一,但它的 搜索功能是基于网络目录,而非基于关键词来对网页内容进行全文检索。 大约 2000 年,Google 借助 PageRank 算法逐渐获得了更好的搜索结果,使得 Google 开始迅速崛起。 ![Google 联合创始人谢尔盖·布林和拉里·佩奇] (https://course.chongbuluo.com/.gitbook/assets/googleplex.jpg) 2000 年 1 月 18 日,李彦宏和徐勇注册并成立了百度。2009 年 6 月 1 日,微软重新命名 的搜索引擎 Bing 推出。 截至目前,活跃的通用性搜索引擎包括 Google,Bing,Yahoo! ,百度和 Yandex。
| �年份 | 搜索引擎 | 目前状态 | | -------- | ------------------------------------------------------------ | ---------------------------------------------------------- | | 1993 | W3Catalog | 可用 | | | Aliweb | 可用 | | | JumpStation | 失效 | | | WWW Worm | 失 效 | | 1994 | WebCrawler | 可用 | | | Go.com | 失效,重定向至 Disney | | | Lycos | 可用 | | | Infoseek | 失效,重定向至 Disney | | 1995 | Daum | 可用 | | | Magellan | 失效 | | | Excite | 可用 | | | SAPO | 可用 | | | MetaCrawler | 可用 | | | Yahoo! | 可用 | | | AltaVista | 失效,重定向至 Yahoo! | | 1996 | Dogpile | 可用 | | | Inktomi | 失效 | | | HotBot | 可用 | | | Ask Jeeves | 可用,更名为 ask.com | | 1997 | [AOL NetFind](https://en.wikipedia.org/w/index.php?title=AOL_NetFind&action=edit&re dlink=1) | 可用 ,更名为 AOL Search | | | Northern Light | 失效 | | | Yandex | 可用 | | 1998 | Google | 可用 | | | Ixquick | 可用 ,更新为 Startpage.com | | | MSN Search | 可用 ,更新 为 Bing.com | | | empas | 失效 | | 1999 | AlltheWeb | 失效,重定 向到 Yahoo! | | | GenieKnows | 可用,更新为 Yellowee.com | | | Naver | 可用 | | | Teoma | 失效 | | 2000 | 百度 | 可用 | | | Exalead | 可用 | | | Gigablast | 可用 | | 2001 | Kartoo | 失效 | | 2003 | Info.com | 可用 | | | Scroogle | 失效 | | 2004 | Yahoo! Search | 可用 | | | A9.com | 失效 | | | Clusty | 可用 | | | Mojeek | 可用 | | | 搜狗 | 可用 | | 2005 | SearchMe | 失效 | | | KidzSearch | 可用,Google Search | | 2006 | Soso(搜 搜) | 失效,与 Sogou 合并 | | | Quaero | 失效 | | | Search.com | 可用 | | | ChaCha | 失 效 | | | Ask.com | 可用 | | | Live Search | 可用,重组为 Bing | | 2007 | wikiseek | 失效 | | | Sproose | 失效 | | | Wikia Search | 失效 | | | Blackle.com | 可用 | | 2008 | Powerset | 失效,重定向到 Bing | | | Picollator | 失效 | | | Viewzi | 失效 | | | Boogami | 失效 | | | LeapFish | 失效 | | | Forestle | 失效,重定向到 Ecosia | | | DuckDuckGo | 可用 | | 2009 | Bing | 可用 | | | Yebol | 失效 | | | Mugurdy | 失效 | | | Scout (Goby) | 可用 | | | NATE | 可用 | | | Ecosia | 可用 | | | Startpage.com | 可用 | | 2010 | Blekko | 失效 | | | Cuil | 失效 | | | Yandex (英语) | 可用 | | | Parsijoo | 可用 | | 2011 | YaCy | 可用,P2P 搜索 引擎 | | 2012 | Volunia | 失效 | | 2013 | Qwant | Active | | 2014 | Egerin | 可用 | | | Swisscows | 可用 | | 2015 | Yooz | 可用 | | | Cliqz | 可用,整合到浏览器中 | | 2016 | Search Encrypt | 可用 | | | Kiddle | 可用 |
第一个阶段,使用倒排索引解决匹配的效率问题,使用文档模型解决基本的相关性,使 搜索引擎变得可用、可扩展,代表比如 Infoseek 。这一阶段只保证了基本的文字相关性, 搜索的真正效果是无法保证的。 第二个阶段,使用超链模型,比如 Google 的 PageRank 算法和百度的超链分析技 术。解决信息的权威性问题,使搜索质量有了质的飞跃。从这一阶段开始,搜索引擎快速普 及与并进入商业化,为 Google 和百度这样的公司带来了丰厚的利润。 第三个阶段,一方面使用更复杂的规则和机器学习排序模型,综合考虑了用户的行为特 征,如商品评论、点赞、收藏、购买等,使得搜索引擎的结果再次提升一个档次,这些在电 商等垂直搜索上表现的会更加明显;另一方面,基于各种先进的自然语言处理技术,充分挖 掘用户搜索行为日志,对 query 进行分析改写以召回更多更好的结果。 第四个阶段,从「有框」搜索时代步入更加人工智能的「无框」搜索时代。人机交互方 式也将更多的是问答式的自然语言加语音的方式,而搜索引擎也更像一个智能机器人,理解 人的自然语言问题,提供更加直接有效的知识和答案。这一阶段目前尚处于起步阶段, Google、Amazon 以及一些优秀的创业公司都在进行积极的探索。 视频推荐:Recap - Google I/O 2019(对 第四阶段的智能化人机交互有更感性的认知) 本教程将在疏通搜索的路径一章,通过对通用搜索引擎工作原理的浅入浅出的描述来指 导各位提高自身的搜索效率。
尽管 Google 是目前全球搜索引擎市场的最大赢家(截止到 2019 年 4 月,Google 全球份 额占比 92.42%,统计来源: StatCounter),但考虑到 本土化、用户习惯等因素,各个国家和地区也有着各自的主力搜索引擎。
国家 / 地区 | 主力搜索引擎 |
---|---|
美国及全球多数国家 | |
俄罗斯 | Yandex |
中国 | 百度 |
韩国 | Naver |
日本 | Yahoo! |
捷克 | Seznam |
仍旧是按照时间顺序,尽可能完整地呈现那些影响过我们的搜索事件。产品上线、技术变 革、隐私、死亡... 总有值得我们铭记和思考的历史节点*(入选事件带有我的个人偏好)*。
时间轴 | 事件概述 |
---|---|
1997.2.5 | 李彦宏申请了[超链分析技术专利] |
(https://patentimages.storage.googleapis.com/da/71/5c/219d85fa4daae3/US59208 | |
59.pdf),是现代搜索引擎领域的重要基础发明之一。 | |
1997.9.15 | Google.com 注册上线。目前是全球流量最大的网站。 |
1998.1.9 | 拉里・佩奇申请了 [PageRank 专利] |
(https://patentimages.storage.googleapis.com/37/a9/18/d7c46ea42c4b05/US6285 | |
999.pdf),意义同上。Google 的崛起也要归功于此。 | |
2001.10.22 | 李彦宏和徐勇创立的百度公司正式发布百度搜索引擎。 |
2007.5.25 | Google 发布街景地图 |
2011 年 6 月 | Google 推出了语音搜索 |
2016 年 4 月 | 魏则西事件。受害者魏则西及其家人因在百度推荐的武警北京市总队第二 |
医院接受了未经审批且效果未经确认的治疗方法,导致耽误治疗,最终不治去世。 | |
2019 年 1 月 | 自媒体新闻实验室编辑方可成在微信公众号撰写的《[搜索引擎百度已死] |
(https://mp.weixin.qq.com/s?__biz=MjM5NDEwNjQ0MQ==&mid=2654281772&idx | |
=1&sn=e6458c0f92121b67c8d3345e7d8fa2ba&chksm=bd4d5d0a8a3ad41cfcbbe1 | |
ba22bc438bc9efa14a4a71e41b0d5c0ba4d0fdb560da0cece46eef&mpshare=1&sce | |
ne=1&srcid=0122KvMHrsboU3a5ZHhmH01u&pass_ticket=VduXd4dwuKVw2obwu | |
dIik7rljLB%2Bdd1NEPTd0%2BlMtQxHPo9bBLVgI5FFBND898tv#rd)》引发网络热议。 | |
百度在首页的搜索结果,基本上有一半以上会指向百度自家产品,尤其频繁出现的是百家 | |
号。 |
移动互联网之于搜索引擎意味着什么?
- 在你初来天府之国游玩儿时,你还会百度一下
成都哪里有好吃的川菜馆子
吗? - 在你准备五一小长假前往川西自驾时,你还会百度一下
川西小环线自驾攻略
吗? - 在你想看看大家对某个问题的看法时,你还会百度一下
演技和流量并存的演员有哪些
? - 在你闲的蛋疼喜好去八卦偶像新闻时,你还会百度一下
迪丽热巴 怀孕
吗? - ...... 虽然在移动时代,搜索引擎的概念被淡化,但搜索入口的重要意义却不容挑衅。只是原本遍 布一张大网的网络信息被逐渐装进了各种 App 的信息孤岛之中。 传统搜索引擎如百度,本就在移动入场转型中步人后尘,残酷的市场分割和流量抢夺,让它 一次次加高自身流量池的护城墙。于是,Google 被诟病不再中立而带有政治偏向,百度则 几乎彻底沦为国民笑柄。 腾讯把微信公众号内容只开放给友军搜狗,百度 PC 端降低知乎内容的权重,扶持百家号. ..... 趋势和利益使得信息整合变得更加困难。在互联网信息从蛮荒走向繁荣的过程中,关键 词是原创、分享;而从繁荣到今日的信息爆炸,关键词则是筛选、整合。所以才出现了信息 不对称、智商税、割韭菜...... 最终,搜索的形态也发生了巨大的变化 —— 传统搜索引擎的价值正在被垂直领域的专业搜索引擎和流行的衣食住行相关 App 所稀释。 再加上百度、搜狗等搜索引擎的广告满天飞,使得人们在搜索一些问题时转而投向其它「非 传统意义的搜索引擎」。
春节想去成都游玩就在几大搜素引擎上搜攻略,搜素出的结果有近一半的网页都是广 告,没办法只有去今日头条搜了下,还好基本上没有广告。
—— 微博用户的抱怨 | 问题示例 | 搜索倾向 | | ------------------------ | ------------ | | 成都哪里有好吃的川菜馆子 | 大众点评 | | 川西小环线自驾攻略 | 蚂蜂窝、穷游 | | 迪丽热巴 怀孕 | 微博 | | 演技和流量并存的演员 | 知乎 | 而在垂直搜索引擎和 App 内寄生的内容生产者,也随着知识付费时代的到来,将其内容精 品化后面向其付费用户。好的内容不再会被轻易且免费地分享到互联网,所以 Google 、百 度等通用性搜索引擎可以索引的内容质量就可能在信息的时效性和实用性上打折扣。 举个例子,吉他谱、钢琴谱等各种曲谱,通用性搜索引擎很难搜到合适的,这个过程往往会 付诸一些时间成本。 而专门的曲谱网站(比如:[找歌谱] (https://www.zhaogepu.com/#gepu))会有很多不同难度的曲谱,如果再充值个 VIP , 那可能就更加爽歪歪了。 综上,即是在顶层思想中要树立「搜索引擎的形态和获取信息的渠道是多元化」的意识。这 样才能才能在接下来的搜索过程中做到不拘一格、多管齐下、触类旁通。
![2019.6.20 - 虫子买的牛奶特写] (https://course.chongbuluo.com/.gitbook/assets/image%20%28171%29.png) 照片中的牛奶是我前几天在天猫国际买的,在我拧开盖子喝了两口之后,我瞅着盒子的侧面 起了一丝的好奇心... 于是我打开手机里的 Google App,点开 Google Lens,对准包装盒侧面的文字,点击搜 索按钮 —— 发生了什么? ![让人倍感极度舒适的搜索交互体验] (https://course.chongbuluo.com/.gitbook/assets/image%20%2812%29.png) 搜索、地图、打电话、访问网站、发送邮件!Google Lens 的搜索结果呈现了所有与这只 盒子侧面文字信息匹配的交互方式。 ![无缝交互体验的截屏拼图] (https://course.chongbuluo.com/.gitbook/assets/image%20%28249%29.png) 如果你在手机里安装了其它 Google 应用,也许就可以有更多的美妙体验。比如 Google 地球。 ![在 Google 地球中造访远在荷兰的牛奶生产厂家] (https://course.chongbuluo.com/.gitbook/assets/image%20%28176%29.png) 整个操作下来也就几秒钟,我就可以一边品着牛奶,一边看着几万公里之外牛奶生产作坊 � 对于并非互联网原住民的我而言,有一种奇妙的时空错位感。 在互联网世界,一切似乎都远在天边,而当我们通过搜索便捷地触达它们的那一刻,又仿佛 近若身旁。这即是搜索引擎技术以及背后整体科技的进步带给我的感触。
在搜索框里输入查询词或语句(教程后文统称为 Query),搜索引擎会在毫秒级别内给出 答案。这中间究竟发生了什么不为人知的秘密?对于意欲提升搜索能力的你是否有必要去了 解呢? 当然!每一次搜索就像是你和机器的对话,机器有如写死的规则一样的运行程式,也有通过 深度学习的自我优化。你是人,但你又是个性的人,要想机器更懂你的意图,我想了解它的 「行为准则」是必要的。并且之所以将其写到教程的头部,也是觉得了解搜索引擎的原理有 助于我们建立一个清晰的搜索行为模型,用于指导搜索过程的思维方式。显然这部分内容对 于整个教程而言是提纲挈领的。
首先,这里推荐观看 Google 官方制作的一个介绍视频:How Search
Works。
在我们进行搜索之前,搜索引擎就已经开始工作 —— 抓取网页并编入索引。所以实际
上,我们搜索的不是网页,而是索引。
搜索引擎使用一种称为网页抓取工具的软件(即所谓的爬虫、蜘蛛)来发现供公众访问的网 页。抓取工具会查看网页,并跟踪访问这些网页上的链接,如同我们在网上浏览内容一样。 这类抓取工具会逐一访问各个链接,并将各网页的相关数据返回至搜索引擎的服务器。
当抓取工具找到一个网页时,搜索引擎的系统就会像浏览器一样呈现该网页的内容。并且会
记下关键信号(从关键字到网站更新频率),然后会在索引中跟踪所有这些内容。 被编入
索引的每个网页中出现的每个字词都分别对应一个条目。在将某个网页编入索引时,搜索引
擎会将它添加到与它包含的所有字词对应的条目中。
通用搜索引擎的技术构建主要包含三个部分:
- 对 Query 的理解
- 对内容(文档)的理解
- 对 Query 和内容(文档)的匹配和排序 这其中,了解搜索引擎对 Query 的理解,是有助于我们和机器更好的沟通。下面展开来 说。
当你的 Query 表意不够明确时,搜索引擎会做出一些「小动作」和你进行「友好磋商」。 比如 Google 将查询扩展应用于提交的搜索查询,使用的技术可以提供比查询用户实际提交 的结果更「智能」的结果。这项技术涉及几个步骤,包括:
- 近似词:一个词的近似词也会出现在搜索结果,比如搜 "translator" 也包含 "translation";
- 缩写:搜索缩写可以返回全拼的结果,如「北约 」可以显示「北大西洋公约组织」结 果;
- 拼写错误: 输入拼写错误时,Google 给出正确的单词拼写;
- 同义词:如果单词在短语或句子中的使用不正确,Google 会根据正确的同义词显示 结果;
- 翻译:搜索引擎可以针对不同语言的特定单词建议结果;
- 忽略单词: 在某些包含无关或无意义单词的 Query 中,Google 会删除这些单词再 搜索。
- 联想查询:在用户输入时,搜索栏下方的列表中为用户提供自动完成的 搜索建议。 ![2019.6.14 - Google 搜索「爱因斯坦」时的联想查询] (https://course.chongbuluo.com/.gitbook/assets/image%20%28223%29.png) 当然,以上这些查询扩展技术是基于高频有规律的 Query 来做针对性优化,在以上情形 下,即便用户犯错,也会被及时自动纠正。但这仅仅是机器学会读懂人心的小学阶段,人类 大脑活动的复杂性远超任何程序算法,下面要介绍的难点才是搜索引擎一直面临的挑战,而 这些难点往往也是因为我们「不友好」的 Query 造成的,了解这些难点,有助于我们规范 和优化 Query。说白了,你不难为它,它也就会给你「好看」。 | 难点 | 举例 | 我们如何做得更好 | | ---------------- | ------------------------------------------------- | ----------------------------- | | 输入不规范 | 丰乳肥臀哪里可以下载 | 丰乳肥臀 pdf | | 关键词的歧义 | 汉堡,城市名还是� ? | 消除歧义 | | 意图强度的判定 | 以图搜图上传一张二次元妹子,搜索引擎猜测是 girl? | 将 girl 修改为 二次 girl 试试 | | 意图的时效性变化 | 明年再来搜「沸腾」,可能就没多少华为的结果了 | 搜索工具中的 时间限定 | 你会发现,通过百度搜索一些符合以上难点的问题时,往往也还能得到不错的结果。因为百 度给自己产品的权重高,而像「百度知道」这样充斥着「难为搜索引擎的问题」的问答平 台,则为这些形形色色、奇奇怪怪的 Query 提供了「气味相投」的数据池。 比如下面这张来自「百度知道」截图。如果参与解答过虫部落第 17 期题目([虫部落邀请码 第 17 期题目:用搜索引擎来弥补遗憾] (https://www.chongbuluo.com/thread-6016-1-1.html))的虫友大概会笑而不语了。对 于搜索引擎而言,无法结合图片来理解这个很口语化语义不明的问题,但正因为有「百度知 道」这样的问答平台,才给这类查询提供了很多精准的结果。但!成也知道,败也知道。很 多参与答题的虫友相信了这个问题下的错误答案...... 所以找到结果并非终点,「小心求证」 在如今的中文互联网环境中是很有必要的。 ![2019.6.14 - 百度一下「中国 不丹 5:0」这个结果比较靠前] (https://course.chongbuluo.com/.gitbook/assets/image%20%28141%29.png) 我们当然无须破费时间精力去了解搜索引擎对 Query 理解的各种算法,只要在平时的搜索 中保持敏锐的观察力,通过结果的呈现规律去发现和体会搜索引擎对你各种意图的各种理 解,就会越来越驾轻就熟地运用它 —— 服务好那个独特的你。
提升搜索能力的目的之一是为了节省时间,而有些人却舍本逐末地将大量时间浪费在不断尝 试的搜索中,这来自于他们相信「万物皆被索引」的执念。消除这种执念需要在搜索前做一 定的预判。不必担心,这种所谓的预判其实就来自于你对事实的足够认知之上,发生在 潜意识,毫秒之间。 比如最常见的,某出版社周一才出版了一本书,你周末就非得在网上找到可免费下载的电子 版???事实是可能吗?可能的概率有多大?大到值得你破费老半天功夫去找吗? 其实就如同我们在生活中做很多事情一样,需要「心里有底,手有分寸」,培养预判能力需 要我们不断积累知识经验,将不必要的时间浪费用在更有价值的事情上。
是用 Google、百度等通用搜索引擎?还是用专业领域的垂直搜索引擎?我们很难去设定一 个标准来作为选择的依据,也没有必要。因为随着我们对各种搜索引擎的日常使用,脑海中 自然会建立一些映射关系:
- 写毕业论文,搜索相关文献 � Google 学术搜索等;
- 申请专利,检索相关资料 � Google Patents、SooPAT 等;
- 找一本电子书 � 电子书搜索中挑一挑;
- 某位当红男演员出轨了 � 微博热搜吃瓜;
- 想了解网友对于某个热门事情的较为深入的看法 � 知乎承包了「如何看待」体;
- 2014 年的虫部落首页是什么样子? � Wayback Machine - Internet Archive;
- 探索英国巨人堤道形成的奥秘 � Google 搜索
巨人堤道
,查看维基百科词条; - ...... 预判是为了避免不必要的时间浪费,而选择亦是为了借助更高效的搜索来节省时间,选择大 于努力。
高效的前提是明确对搜索流程中自己可以有所作为的部分,然后再针对「如何去优化」进行 更深入的学习和实践,以此来不断积累经验,方能对看似简单的原理做到驾轻就熟。 ![我们可以在通用搜索引擎中做的3件事] (https://course.chongbuluo.com/.gitbook/assets/2019-06-20_13-17-19.png)
说起来,对于关键词的使用可能是最容易被人忽视的。网络上也鲜有人专门针对这部分展开 阐述,而是剑走偏锋地去渲染搜索指令和一些冷门搜索引擎的神奇功效。真是傻啊! 即便是进入 AI 时代,我们使用搜索引擎时最高频的操作依然是输入关键词。显然,这是不 可绕开的话题。那么「修改关键词」包含哪些基本操作呢?
操作 | 场景 |
---|---|
减少或避免使用没有语义的字词 | 没有哪个作者会在网页 title 里堆积一些没有语义的词 |
汇 | |
用英文同义词替换中文关键词 | 判断信息是源自外网,那么英文词结果通常更多更准确 |
| | 尝试使用直觉式的问题表述方式 | 通过百度搜索,在百度知道的答案中解决许多此类问题 | | 注意「搜索提示」和「相关搜索」 | 搜索引擎会在输入时提示,或者在结果中给出搜索建 议 | 减少或避免使用没有语义的字词 和 尝试使用直觉式的问题表述方式 看起来似乎是 矛盾的,但由于搜索引擎在自然语言处理方面的技术进步,以及类似百度知道这样拥有大量 直觉式口语化的提问,使得我们在搜索很多日常琐碎的问题时,很容易在百度知道里找到答 案。 ![修改关键词基本操作演示,用手机壳的颜色区别] (https://course.chongbuluo.com/.gitbook/assets/image%20%28216%29.png)
这部分内容稍后会在 Google 搜索指令部分呈现,还会在搜索的奇技淫巧部分强调。它们中 的绝大部分在通用搜索引擎中都是适用的。 ![高级搜索指令的应用示例] (https://course.chongbuluo.com/.gitbook/assets/image%20%283%29.png)
我们常用的搜索引擎基本都提供了搜索工具,并且各自的功能有所差异。同一搜索引擎如 Google,网页版的搜索工具通常要比移动版的功能更多。 无论是网页搜索还是图片或新闻搜索,这些搜索工具都是非常具有实用性的,但却因为被隐 藏在二级菜单而容易被用户忽视,而本教程中的诸多知识节点中将用特别有说服力的案例来 展现搜索工具的实用性。 ![应用图片搜索工具筛选老婆的照片] (https://course.chongbuluo.com/.gitbook/assets/image%20%28102%29.png)
小虫子在完成编程入门和进阶的学习之后,总感觉还缺点什么 � 他联想到有句俗话叫「是 骡子是马,拉出来溜溜」,于是他意识到自己应该找一些专门运营编程类竞赛的网站来练练 手。 并且他希望搜集到足够多的这类网站,然后从中挑选适合自己的。那么,如何快速地搜集 呢?
我们尝试结合本节所述的高效搜索模型 Beta 来走一遍流程。
即便对于初涉 IT 技术领域的人来说,多多少少也听闻过一些编程挑战赛。那么在此见识的 基础上,我们会更有把握搜集到足够多的此类信息。虽然预判在这里所显现的意义并不明 显,但别担心,我说过这只是一个下意识的判断过程,也许就在毫秒之间。
如果你不知道有 SimilarSites 可以搜索相似网站的服务 存在。那么,你将免于选择的烦恼 —— 但同时也可能会错过搜索更多相关内容的机会。 那么,我们先使用通用搜索引擎 Google 或者百度搜索结合最常规的关键词输入来试试看, 结果不满意的话,还可以试试高级搜索指令。
Google 搜索:编程比赛网站
结果不错,如果看了知乎上人推荐的还不够,那 —— 看看机器推荐的?选择一两个已知的
编程竞赛网站,使用 Google 高级搜索指令进行搜索:
related:leetcode.com
;
related:hackerrank.com
就可以搜集大相当多的此类型网站。
当然,如果你还知道 SimilarSites 的存在,那么还可以
进一步尝试搜索,看看有没有什么意外的发现。由于 SimilarSites 搜索算法所依据的分类信
息较为宽泛,所以搜索结果中也会出现很多相似度不够高的网站。
![SimilarSites 对网站的归类]
(https://course.chongbuluo.com/.gitbook/assets/image%20%28158%29.png)
再换一个思路:有时检查网站的反向链接(来自其它网站的进入链接)可能会包含一些「臭
味相投」的网站。方法是通过 Backlink Watch 这个
网站或者 Google 高级搜索指令
link:domain.com
来搜索。
以上即是对高效搜索模型 Beta 的一次完全实践,各位也可以在平时的搜索过程中有意
识地复制此模型。其价值在于疏通了一条简明的搜索思维路径,并且在不断扩展着我们固有
搜索经验的疆界。
其实我一开始起得标题是「万物始于 Google!」。但是介于这中说辞带有某种浮躁之气我最 终还是修改了,只留在正文聊一聊。 那么,有人会对「万物始于 Google!」提出质疑吗?怎么解释这句话? 稍微了解搜索引擎工作原理的朋友都晓得爬虫采集后存储的数据量是搜索引擎的核心,而 Google 则拥有全球最庞大的网络信息存储服务器集群。它们分布在世界各地... ![分布于全球各地的 Google 数据中心] (https://course.chongbuluo.com/.gitbook/assets/image%20%28252%29.png) Google 街景地图自助游:Google 数据中心 - 北卡罗莱纳州勒努瓦 (Lenoir)__ 除非某些网站在 robots.txt 文件中设置了限制搜索引擎爬取的指令,否则,Google 爬虫将 日夜兼程地爬取海量网络信息 ,它就是网罗万物的最强大脑。 接下来,可能会有说:我通过某电子书搜索引擎 A 很快找到了一本书,而通过 Google 则 煞费一番功夫甚至没找到,始于 Google 不就牵强了?不,我敢肯定你可以通过 Google 搜索到 A,但你却无法通过 A 搜索到 Google,这便是「始于 Google」的终极奥义。 万物始于 Google! 那 Google 又始于何处呢?
Google 的故事始于 1995 年的斯坦福大学。拉里・佩奇正在考虑斯坦福大学毕业,而那里 的学生谢尔盖・布林则被派去向他展示。 根据一些说法,他们在第一次会议期间几乎对所有事情都持不同意见,但到了第二年,他们 达成了合作伙伴关系。他们在宿舍工作,他们建立了一个搜索引擎,使用链接来确定万维网 上各个页面的重要性。他们称这个搜索引擎为 Backrub。  不久之后,Backrub 被重命名为 Google。这个名字是关于数字 1 的数学表达式,然后是 100 个零,并恰当地反映了拉里和谢尔盖的使命「整合全球信息并使其普遍可用和有用」。 在接下来的几年里,Google 不仅引起了学术界的关注,也引起了硅谷投资者的关注。1998 年 8 月,Sun 联合创始人安迪・贝托尔斯海姆以 10 万美元的价格给拉里和谢尔盖写了一张 支票,Google 公司正式诞生。通过这项投资,新成立的团队从宿舍升级到他们的第一个办 公室:位于加利福尼亚州门洛帕克郊区的一个车库,由 Susan Wojcicki(Google 16 号员 工,现在的 YouTube 首席执行官)拥有。笨重的台式电脑,乒乓球桌和明亮的蓝色地毯为 这些早期和深夜设置了场景。(保持[丰富多彩] (https://www.google.com/search?q=google+office+locations&espv=2&biw=2560 &bih=1253&site=webhp&source=lnms&tbm=isch&sa=X&ved=0CAYQ_AUoAWoV ChMIv-ih3J7exwIVx0qICh3-DQ-Q)的传统一直持续到今天。) 即使在一开始,Google 的行为风格就不按常理出牌。从 Google 的最初服务器(由乐高搭 建)到 1998 年的第一个 “doodle”。“不做坏事” 和 “ [我们知道的十件事是真的] (https://www.google.com/about/philosophy.html) ” 确立了 Google 刻意而非传统的 精神。 ![斯坦福大学的第一台 Google 服务器安装在由乐高积木制成的定制外壳中] (https://course.chongbuluo.com/.gitbook/assets/image%20%2893%29.png) 在随后的几年里,公司迅速扩张。Google 已经超越了车库的小空间,最终搬到了加利福尼 亚州山景城的现有总部(又名 “The Googleplex”)。以创新思维做事的精神促成了这一 系列成就。  不断寻求更好的答案仍然是 Google 所做的一切的核心。今天,Google 在全球 50 个不同 国家 / 地区拥有 60,000 多名员工,其数百种产品已被全球数十亿人使用,从 YouTube 和 Android 到 Smartbox,当然还有 Google 搜索。
透过官方博客,你可以了解到 Google 员工对自身产品,技术和 Google 文化的见解。 | 公司 | 开发 | | -------------------------------------------------------- | ------------------------------------------------------------ | | 公共政策博客 | [开发者博客] (https://googledevelopers.blogspot.com/) | | 研究博客 | [广告开发者博客] (https://googleadsdeveloper.blogspot.com/) | | 学生博客 | [Android 开发者博客] (https://android-developers.blogspot.com/) |
作为用户最直观的感受一定是来自于 Google
doodles � 我挑选了几个很好玩儿的 doodles,在
此让各位感受或重温一下 Google 的标识涂鸦文化。
| 主题 | 时间 | 特色
|
| ------------------------------------------------------------ | ------------------ |
------------------------------------------------------------ |
| 纪念花园精灵 |
2018 年 6 月 10 日 | 交互式游戏,音乐欢快 |
| 魔方 | 2014 年 5
月 19 日 | 交互式游戏,流畅炫酷 |
| [吃豆人诞生 30 周年]
(https://www.google.com/doodles/30th-anniversary-of-pac-man) | 2010 年 5 月 21
日 | 交互式游戏,怀旧([比赛]
(https://www.chongbuluo.com/forum.php?mod=viewthread&tid=2477)) |
[512 汶川地震映象:Google logo 全球首次改至黑白色]
(https://www.chongbuluo.com/thread-4905-1-1.html)。以此表达对这一悲恸时刻的共
同悼念。
各位可能都晓得,虫部落快搜、[学术搜索] (https://scholar.chongbuluo.com/),甚至[电子书搜索] (https://ebook.chongbuluo.com/)的默认排序第一屏展示的都是 Google 相关搜索产品, 并且调用的是 Google 官方的搜索接口,而非镜像。 所以,在没有开启代理的情况下,你当然不能直接使用。所以,偶尔就有人回来问我,它又 不能用,你放那干嘛? 今天我在这里解释下:首先,不是不能用,只是需要额外的网络环境支持。我也不可能冒着 被请喝茶的风险去提供可直接访问的镜像服务,这是求生欲,更是想虫部落在「让搜索更简 单」的使命督促下更长久地为大家服务的信念;然后,再说为什么放在第一位。因为这表征 着在搜索领域 Google 无可争议的最强地位。你可以因为麻烦退而求其次地用百度、必应甚 至搜狗和 360,但我更希望你以 Google 为主力搜索,你在代理上花费的那一小撮费用, 远不及它为你的学习和工作节省的时间以及创造的价值。 至于被询问很多的关于「你用的什么梯子」的问题,在此不便讨论。我能给的建议就是:找 一个付费且靠谱的,在你经济能力的范围内,秉承「贵即是好」的原则去筛选。
自 1998 年以来,Google 搜索一直在帮助人们解决各种问题,时至今日已过去 20 年了, Google 搜索已经建立了许多其他有用的功能和工具来帮助我们更好地搜索问题。尽管由于 众所周知的原因让这其中的一些功能显得「然并卵」,但我相信各位的未来空间一定不止局 限于 960 万平方公里的土地 ✈ 所以... 让我们来完整了解下这 20 个技巧。
以下是一些可以让你计划一天并通过搜索了解情况的方法。
- 在附近的活动中填写你的日程安排: 使用手机,只需搜索 我附近的活动 或 美食节 等特 定活动类型,就会看到来自网络的本地活动列表。
- 电影放映时间和门票:当您想要看电影时,搜索会将放映时间,剧院位置和评级集中在一 起。它可以很容易地决定哪个电影和位置最适合你。
- 食谱搜索:如果你正在急于寻找一种食谱,只需在手机上搜索你想要的东西(比如 鸡巴 马干酪),你就会看到食谱建议的旋转木马。
- 实时体育比分: 无论你是狂热的体育爱好者还是球星粉丝,搜索都可以让你轻松掌握最 新的分数。输入您最喜欢的球队或联赛的名称(如 英超 皇家马德里),并获得最近比赛的 实时得分和回顾。
- Google 图片的样式和购物帮助:当您正在探索样式创意或使用 图像搜索浏览下次购买 时,可以购买的产品图片在 Google 应用和移动网络中标有 “产品” 徽章。标有 “产品” 的图片包括价格,评论和可用性,使研究和购物更容易,更快捷。
当你在寻找与你的职业,教育或健康相关的信息时,Google 可以快速访问工具和可靠的资
源,帮助你做出明智的决策。
6. 找到您的下一份工作: 现在,Google 在全球 90 多个国家 / 地区为用户提供工作,
你可以直接在 Google 上搜索工作。尝试搜索 我附近的工作
或 零售工作
以浏览网络上的工作。您还可以保存
作业设置警报,映射潜在的通勤并单击以应用。
**7. 找到合适的大学:**在搜索上,你可以找到[有关四年制美国大学的]
(https://www.blog.google/products/search/college-search-google/)更多[信息]
(https://www.blog.google/products/search/college-search-google/),包括有关入
学,费用和学生生活的信息。您可以在注册后 10 年内围绕毕业率和典型年收入挖掘数据。
**8. 帮助解决健康问题:**寻找常见的健康问题,如[流感]
(https://www.google.com/search?q=influenza)或**健康问题**[脚踝扭伤]
(https://www.google.com/search?q=sprained%20ankle),你会在知识小组中找到相关
的医学事实。我们将向您展示典型的症状,治疗方法和其他细节 - 例如病情的常见程度,是
否具有关键性或传染性,受影响的人群年龄以及更多 - [来自可靠来源]
(https://googleblog.blogspot.com/2015/02/health-info-knowledge-graph.html)和
医生审查。如果您在移动设备上搜索[临床抑郁症]
(https://www.google.com/search?q=clinical+depression),我们还可以轻松访问[临床
验证的私人筛查测试]
(https://www.blog.google/products/search/learning-more-about-clinical-depressio
n-phq-9-questionnaire/),其结果可以帮助您与您自己的护理提供者进行对话。
当你需要快速回答来帮助你完成日常任务时,Google 会在搜索中提供工具以帮助你: 9. 费用计算:当你在餐馆时,你可以使用 Google 来计算你的小费。只需搜索 tip calculator (小费计算器),输入你的用餐费用以及你想要小费的百分比。 10. 现金兑换:如果你正在外出旅行,这里有一个赚大钱的工具:你可以直接在 Google 上 获得实时货币转换。搜索 $500 in euros ,你将获得一个包含当前汇率和交互式图表的框。 11. 跟踪包裹:您可以直接在 Google 搜索栏中输入任何 UPS,USPS 或 Fedex 跟踪号 码,它会显示有关您的包裹的跟踪信息。 12. 快速访问会议、航班等:如果您不想切换选项卡,搜索可以帮助您查找有关即将到来的 计划的信息。如果您已登录自己的 Google 帐户,则搜索 “我的旅行” 或 “我的约会” 会向您(仅限您!)显示有关即将开始的航班,酒店预订以及您在 Gmail 和 Google 日历 中的日程安排的相关结果。 13. 营养参数:你可以搜索营养信息并找出你日常食物中的卡路里数量。例如,你可以问 “ 巧克力蛋糕中有多少脂肪?” 或 “番茄酱中有多少糖?” 谷歌将为你打破营养状况。 14. 定义和同义词:您可以将 Google 用作词典和词库。尝试搜索 [loquacious mean 是什 么意思],你可能会发现自己不停地谈论这个功能。
当您提出复杂的问题或希望深入研究某个主题时,搜索可以成为您的共同研究员。 15. 提出复杂的多部分问题:您可以向 Google 提出 “组合查询”,要求我们在解决第二部 分之前解决问题的第一部分。例如,如果你搜索 [NSYNC 成员何时出生],你会(感觉老 了)看到 Justin,JC,Chris,Lance 和 Joey 的出生日期。 16. 使用图像搜索:在计算机上,将您自己的照片上传到 Google 图片,以在网络上查找相 同或类似的照片。点击 Google 图片中的相机图标,Google 也会告诉您相片的来源和其他 详细信息。现在你可以知道模因真正来自哪里了。 17. 检查如何正确地说出大量数字:输入任意长号并在搜索结尾添加 “= english”,您将 找到拼写单词中数字的正确方法。尝试 6006131520(提示:它不是 “谷歌是 20”)。 18. 在一段时间内搜索:您可以将搜索范围缩小到特定日期范围,并仅查看在此期间发布的 内容。如果您正在寻找有关如何在某个时间点覆盖新闻主题或者为历史文章寻找资源的洞察 力,这可能很有用。 19. 在网站内搜索:如果您正在寻找特定发布商的文章或页面,搜索将让您将结果集中在该 网站上。只需在网址之前添加 site: 即可将结果限制为该发布商,然后您可以按新近度排序 或添加其他关键字以缩小搜索范围。 20. 高级搜索:如果所有这些技巧仍然无法满足您的需求,您可以使用高级搜索来应用多个 过滤器,例如指定要排除的术语或仅查找某些语言,区域的页面,网站或文件格式。
项目 | 操作 |
---|---|
搜索设置 | 更加全面地使用 Google 搜索的最好方式是点击「高级搜索」中查找选 |
项。 | |
手气不错 | 点击”I'm Feeling Lucky” (手气不错)可以直接访问关键词搜索第一 |
个结果的网页。 | |
安全搜索 | Google 的安全搜索可以保护你免受成人内容的侵犯,你可以在搜索设置 |
中开启这个功能。 | |
取消区域限制 | 访问 https://www.google.com/ncr 可以取消区域限制,防止跳转 |
到 google.com.hk 去。 | |
习惯偏好 | 在 www.google.com/account 上 |
注册一个帐号便可以保存你的 Google 使用习惯偏好。 | |
广告设置 | 在 Ads Preferences 中 |
可以设置不显示谷歌广告。 | |
搜索历史 | 在 Google History 可以查看搜索历史 |
并提供下载。 | |
Google 帐户安全 | 在 |
Permissions 可查 | |
看帐户授权情况, | |
Activity 可查看登录情 | |
况,Dashboard 可查看活动情况。 | |
下载 Google 数据 | 在 Google Takeout |
中可以下载你的所有谷歌数据。 | |
Google 帐户删除 | 在 Google Downgrade |
中可以删除你的谷歌帐户。 |
作为最会玩儿的互联网公司之一,Google 在搜索中为用户埋下了不少有意思的彩蛋。下面 是一个不完全清单(我相信总有未被发现的彩蛋)。
- 使用 Google 图片[搜索 “atari breakout”] (https://www.google.com/search?tbm=isch&q=atari+breakout),界面会从正常的搜 索结果转换成类似于雅达利的电子游戏打砖块,且可以在屏幕上玩游戏。当游戏胜利后,搜 索结果会随机改变,并可再次开始游戏。
- 搜索 “do a barrel roll”( 来翻转一下)或 [“Z or R twice”] (https://www.google.com/search?q=z+or+r+twice) 将会 360° 旋转搜索结果。
- 搜索 “askew”(需使用支持 CSS3 的 浏览器),将会使页面稍向右偏转。搜索其他内容则将使其恢复。
- 2011 年 12 月至 2012 年 1 月之间,[搜索 “let it snow”] (https://www.google.com/search?q=:google:let+it+snow&hl=en)(使其下雪),将 在搜索结果模拟降雪和霜冻。一段时间后,搜索结果屏幕起雾,只有蓝色的搜索按钮除去了 霜。用户可以点击页面除霜,并可以像在窗户上一样用鼠标拖动写字(此时的链接并不起作 用,即使整个画面手动解冻)。直到按下除霜按钮,搜索屏幕将停止起雾。
- 2011 年 12 月至 2012 年 1 月期间,[搜索 “xmas”] (https://www.google.com/search?q=xmas&hl=en)(圣诞)或 [“christmas”] (https://www.google.com/search?q=christmas&hl=en)(圣诞节)或任何含有以上二者 的短语,搜索栏下会显示七彩的灯串。
- 搜索 “festivus”,将会在结 果侧边显示朴实的铝杆,以承认世俗节日 Festivus 的存在。同时,在搜索结果数量前,将 显示 “一个 Festivus 奇迹!”(A festivus miracle!)。该彩蛋 2012 年 12 月 10 日推 出。
- 搜索 “zerg rush” 返回的 页面将会带有不停移动的字母 “O”,“O” 将蚕食页面上的所有内容。用户可点击三次 “O” 以清除。此彩蛋参考自早期暴雪娱乐的游戏星际争霸,其包含角色 “虫族 rush”。 不可避免地,“O” 会破坏所有内容,并分别由黄色和红色的 “O” 组合成两个 “G”, 参考自在线对战的礼貌性结束用语 "GG",指 “good game”。
- [搜索 “Conway's Game of Life”] (https://www.google.com/search?q=conway%27s+game+of+life) 返回的搜索结果页 的右上角将播放康威生命游戏以及一组控制钮(播放、暂停、最大化 / 还原、下一步)。若 有足够的时间,则会在右侧形成 “Google” 这个词。
- 搜索 “恐怖” 或 “万圣节” 只要将鼠标光标悬停在页面, 返回结果随着三只停在右上角蝙蝠飞走。此彩蛋于 2012 年 10 月 31 日推出。
- 搜索 “yes yes” 播放流行的 米姆剪辑。
- [搜索 “how much wood could a woodchuck chuck if a woodchuck could chuck wood”] (http://www.google.co.uk/#gs_rn=15&gs_ri=psy-ab&suggest=p&pq=how%20muc h%20wood%20can%20a%20woodchuck%20chuck%20if%20a%20woodchuck%20c ould%20chuck%20wood&cp=37&gs_id=4s&xhr=t&q=how+much+wood+could+ a+woodchuck+chuck+if+a+woodchuck+could+chuck+wood&es_nrs=true&pf=i& sclient=psy-ab&oq=how+much+wood+could+a+woodchuck+chuck&gs_l=&pbx= 1&gs_ivs=1&bav=on.2,or.r_qf.&bvm=bv.47380653,d.ZWU&fp=9a303c08cdeb5d94 &biw=1920&bih=955&gs_ivs=1&tts=0)(如果土拨鼠能夹木头,那么一只土拨鼠能夹 多少木头)( **请注意:**仅可通过语音搜索)将带来标准结果,但 Google 的语音会 说:(英语:a woodchuck would chuck as much wood as a woodchuck would chuck if a woodchuck could chuck wood.)
- 搜索 “epic sax guy” 播放 2010 年欧洲歌曲节的由欧洲流行三人组合乐队 SunStroke Project 的歌曲。
- 搜索 “dreidel” 或 搜索 “menorah ” 会在搜索结果页面左上角显示一个光 明节陀螺,右上角显示一个犹太教灯台。
- 搜索 “marquee html” 会使搜索结果页面的 “找到约 x 条结果 (用时 y 秒)” 水平循环滚动,就像使用了 marquee HTML 元素一般。
- 生命、宇宙以及任何事情的终极答案,[the answer to the ultimate question of life, the universe, and everything](https://www.google.com/search?q=the+answer+to+the+ultimate+que stion+of+life,+the+universe,+and+everything) = 42
- 搜索字母
e
可以调出计算器 - “https://www.google.com/humans.txt” 显示了一个纯文字文件,内容旨在于提醒 用户 Google 不仅创建于技术基础上,且由许多人共同创建。它也欢迎有兴趣的用户访问他 们的职业页面。
| 愚人节 | 外太空 | | ----------------------------------------------------------- | ------------------------------------------- | | 意念搜索 | Google Sky | | 嗅觉搜索 | Google Moon | | 穿越搜索 | Google Mars |
在 Google 搜索框中输入数学公式,进行单位转换和颜色拾取时,如何快速获得答案。
- 天气:搜索天气可查看您所在地点的天气信息,如果在 “天气” 后加上城市名( 例如天气北京),则可查看相应城市的天气信息。
- 字典:在任意字词前加上定义即可查询其定义。
- 计算:输入数学公式(例如 3*9123)或求解复杂的图形公式。
- 单位换算:输入任何换算内容,例如 3 美元兑换欧元。
- 体育:搜索球队的名称,即可查看相关赛程和比赛得分等信息。
- 基本信息:搜索名人、地点、电影或歌曲的名称即可看到相关信息。
- 在 Google 搜索框中输入计算式
- 搜索:[
计算器
](https://www.google.com/search?newwindow=1&hl=en&source=hp&ei=-6_RXO 6tJcWjkwWN6pKIBg&q=%E8%AE%A1%E7%AE%97%E5%99%A8&btnK=Google+Se arch&oq=%E8%AE%A1%E7%AE%97%E5%99%A8&gs_l=psy-ab.3...837.837..1182...0 .0..0.507.507.5-1......0....2j1..gws-wiz.....0.T2_k4hPI1iQ)或Calculator
缓存链接显示的是 Google 最后一次访问某个网页时该网页显示的内容。为防止当前网 页出现无法显示的情况,Google 会为每个网页拍摄快照作为备份。这些网页随即会被纳入 Google 的缓存。如果您点击显示 “网页快照” 的链接,就会看到 Google 先前存储的网 站版本。 ![网页快照在链接右侧▼的二级菜单中] (https://course.chongbuluo.com/.gitbook/assets/image%20%28142%29.png) 如果您要访问的网站加载速度很慢或没有反应,则可改为访问相应的缓存链接。教程后面也 会讲到如何从 Google 搜索结果中移除缓存版页面(隐私保护方面的需求)。
知识图谱(Knowledge Graph)使用语义检索从多种来源收集信息,以提高 Google 搜索 的质量。它于 2012 年 5 月 16 日正式发布,知识图谱除了显示其他网站的链接列表,还提 供结构化及详细的关于主题的信息。其目标是让用户使用此功能提供的信息来解决他们查询 的问题,而不必导航到其他网站并自己汇总信息。 知识图谱一般呈现在搜索结果页面的右侧单元。 ![2019.6.14 Google 搜索「爱因斯坦」获得的知识图谱] (https://course.chongbuluo.com/.gitbook/assets/image%20%28241%29.png)
可能很多人在平时的搜索中基本都没怎么正眼瞧过右侧的知识图谱,我想通过全面了解它的 特色后,可能会对其价值有重新的认知,从而更好地为你所用。
通过知识图谱,Google 可以更好地理解用户 Query,可以总结围绕该主题的相关内容,包
括用户可能需要的特定事项的关键事实。例如,搜索居里夫人
,你会看到她出生和死亡的
时间,包括死因,还会得到她的教育和科学发现的详细信息:
如果关键词有歧义或者模糊不清,比如搜索列侬
?是歌手?还是专辑?在 Google 了解其
中的差异,并且可以将搜索结果缩小到你想要的范围 —— 只需点击其中一个链接即可查看
特定的结果片段:
所有知识图谱中最有趣的部分可以帮助我们做出一些意想不到的发现。可能会看到一个新事
实或新项目,按照提示进入查看详细的内容。 比如搜索巴塞罗那,「制定行程计划」中的
内容就很棒!
Google 创始人拉里・佩奇 (Larry Page) 曾这样描述理想的搜索引擎:能够准确理解你的意 图,并返回你所需的确切信息。因为所有用户都希望获得针对其查询的快速解答。 Google 每年对搜索做出的改进高达上千项,我们无法一一悉知这些具体的改进,所以我们 有必要在平时的搜索中留意 —— 针对哪些特征的搜索,Google 会提供一目了然的实用 回复,而无需我们再点击进入某个结果页面。这对提升我们的搜索体验和效率都是有帮助 的。
在 2012 年,Google 推出了知识图谱,该数据库中的现实人物、地点和事物超过 10 亿
条,而它们之间的事实和联系也已超过 500 亿条。世界是由真实的事物组成,而不仅仅是
文本字符串。因此,我们打造了知识图谱来展示事物之间是如何互相联系的。
eg: 埃菲尔铁塔多高
有时,我们需要获得针对某些查询的直接答案,因此我们便与可提供您正在查找的信息和服
务的企业合作,并许可其内容直接在搜索结果页上提供实用回复。比如和 FIFA 合作提供足
球相关数据。
eg: 女足世界杯赛程
Google 通过将用户注意力集中到以编程方式生成的摘要(来自被算法视为与所询问的特定
问题相关的网站),精选摘要有助于提供对问题的快速解答。所有精选摘要均包含从第三方
网站引用的信息摘要,以及对应的页面链接、页面标题和网址。
eg: 埃及金字塔哪座最高
有时我们搜索的问题,最佳答案未必总是单个实体,也可能是一系列互相关联的人、地点或
事物。在这种情形下,Google 通过将知识图谱与网络的集体智慧相结合,提供完整的列
表。
eg: 德国数学家
Google 搜索对人们的一些特征 Query 做了针对性的优化,即借助运算符或字词(后文统 称为搜索指令),以便让搜索结果更加精确。 在使用过程中应注意以下两点:
- Google 搜索通常会忽略不属于搜索运算符的标点符号。
- 请勿在符号 / 字词和搜索字词之间加上空格。例如,
site:chongbuluo.com
可以正常发 挥作用,但site: chongbuluo.com
则不行。 下面将以列表的形式为各位呈现最实用的 Google 搜索指令清单。
搜索指令 | 功能 | 示例 |
---|---|---|
@ | 搜索社交媒体 | |
$ | 搜索特定价格 | camera $400 |
# | 搜索 # 标签 | #throwbackthursday |
- | 从搜索结果中排除特定字词 | 马云语录 - 女人 |
"" | 搜索完全匹配的结果 | "tallest building" |
.. | 在某个数字范围内执行搜索 | camera $50..$100 |
OR(大写) | 组合搜索 | marathon OR race |
site: | 搜索特定网站 | site:chongbuluo.com |
related: | 搜索相关网站 | related:time.com |
info: | 获取网站详情 | info:giffox.com |
cache: | 查看网站的 Google 缓存版本 | cache:google.com |
以下补充搜索技巧非出自官方的简明文档,但仍旧为官方承认且截止目前实测仍旧有效,故 作补充。
搜索指令 | 功能 | 示例 |
---|---|---|
\ | 效用等同于 OR | apple\google, apple OR google |
* | 泛搜索,表征未知部分,只适用于英文 | * is the mother of success |
《》 | 只查询图书、影视作品,只适用于中文 | 《钢铁是怎样炼成的》 |
def: | 查询关键词的定义 | def:diversity / google def: |
inurl | 查找在 URL 地址里有搜索关键词的页面 | inurl:download |
intitle | 查找在网页标题里有搜索关键词的页面 | intitle: |
filetype | 查找特定文件格式的结果 | 机器学习 filetype:csv |
link: | 查看网站的反向链接 | link:chongbuluo.com |
AROUND | 搜索包含给点单词之间最大分隔数的网页 | 华为 AROUND (5) 必然 |
当然以上这些搜索指令还可以随意搭配组合使用,稍后就会有案例呈现。 |
罗素有一句广为流传的名言:
参差多态乃是幸福的本源。 这句话之所以被广泛传播,很大程度上归功于王小波。他在《思维的乐趣》中引用了这句 话。 这句话出自罗素的《西方哲学史》(A History of Western Philosophy)第四章「埃拉斯 摩和莫尔」。 It must be admitted, however, that life in More’s Utopia, as in most others, would be intolerably dull. Diversity is essential to happiness, and in Utopia there is hardly any. This is a defect of all planned social systems, actual as well as imaginary. diversity 翻译成中文,意即「多样、差异、异样」。假设你对于这个单词很陌生,以至于 忘却 —— 只记得后面的部分,以及它是罗素所言。那么你会如何通过搜索引擎找回这个单 词?
熟悉了 Google 搜索指令清单,你自然会联想到使用 * 符号来进行模糊匹配。但实际操作发
现 is essential to happiness
又被搜索引擎进行了语义拆分,那么再使用 "" 符号进行「
加固」也许是个不错的选择。
Google 搜索 *"is essential to happiness"
。虽然排在第一条的图片搜索结果里已经有了
答案,但第一页下面的结果中却充斥着 "I think money is essential to happiness..." 等诸
多「混淆视听」的结果。
所以我再次对 query 进行优化 —— 补充了作者关键词 Russell。
即 *"is essential to happiness" Russell
。搜索结果如下:
这一次我们看到了最理想的答案呈现方式 —— 精选摘要。
精选摘要:当用户在 Google 搜索中查询问题时,Google 可能会在搜索结果页顶部的
特设「精选摘要」区块中显示搜索结果。此「精选摘要」区块会显示从相关网页上提取的答
案摘要以及对应的页面链接、页面标题和网址。其外观也异于一般搜索结果。并且精选摘要
来自特殊的算法处理,而非人为设定。
当然,如果你对搜索指令的应用比较感兴趣,还可以尝试运用「控制变量法」来测试其它
query 的效果。我这里给出一个实测表格:
Query | 效果 |
---|---|
*"is essential to happiness" Russell |
� |
*is essential to happiness Russell |
� |
"is essential to happiness" Russell |
� |
*"is essential to happiness" |
� |
is essential to happiness |
� |
毋庸知晓这些结果排序背后的特殊算法和规则,只需要多多尝试,你就会越来越懂得如何灵 | |
活运用关键词让搜索引擎更懂 —— 你的意图。 |
鉴于这个案例的主题(参差多态乃是幸福的本源)具有鲜活(因为这个案例)的积极意义,
我遂将其作为 T-shirt 的设计图案,效果如下:
![设计样板图]
(https://course.chongbuluo.com/.gitbook/assets/image%20%28117%29.png)
![实拍试穿效果]
(https://course.chongbuluo.com/.gitbook/assets/image%20%2841%29.png)
T 恤定制选的是很多大公司都比较倾向的某专业 T 恤定制的创业公司(百度一下 T 恤定制
就能搜到)。我的原则是:「贵即是好」。当然了,再「贵」它也是棉花弹出来的,不能
吹上天是不是?不过,希望优秀的你,穿上它,可以装 B 带 Ta 飞。
所以我选的都是定制平台提供的面料里最好的,去年是天竺棉,今年看到有更贵的(我也不
懂它到底好不好),立马换了高支棉。如果 T 恤单独只定做一件,那么价格是 270 多,如
果是 10 件... 只有到 100 件,才能将成本降到 60 以下。所以...... 我硬着头皮定了 100 件。
对于虫部落套餐的付费用户,可享受这款 T 恤的专属优惠价:69 元(包邮)。如果硬要说
赚,那就赚个口碑吧。最后,喜欢且有意向购买的微信找虫子。
在众多的高级搜索指令中,可能各位对 AROUND 运算符的使用还比较陌生,甚至看了我整 理的列表中的介绍还是一脸懵逼。不着急,咱们结合真实场景的案例来认识它。
假如你想知道作为中国最赚钱的游戏公司 —— 腾讯的老板 —— 马化腾本人对于游戏有过 怎样的论述和表达,你会如何搜索呢?
直接搜索 马化腾 游戏
的结果肯定很糟糕,事实亦是如此。那我们试试 AROUND 运算
符?
Google 搜索:马化腾 AROUND(5) 游戏
![2019.1.12 - 网页版 Google 搜索结果部分截图]
(https://course.chongbuluo.com/.gitbook/assets/image%20%2829%29.png)
看到了吗,小马哥最大的爱好是看星星,从小就志存高远啊。回到知识点来说,其实
AROUND 的意义似乎有点抽象,但这恰恰也赋予了我们对其使用的想象空间。下面就来说
说它的用法。
当您不确切地知道要查找的单词或数字时,Google 会提供多个可提高灵活性的运算符,例
如数字范围运算符 和 通配符运算符。同样,AROUND 运算符允许我们搜索由给定
最大单词分隔数的特定语句。
格式:关键词 AROUND(阿拉伯数字) 关键词
AROUND 必须大写;括弧是西文括弧。
示例 | 备注 |
---|---|
华为 AROUND (3) 必然 | ✅ |
华为 AROUND3 必然 | ❌ |
华为 around (3) 必然 | ❌ |
华为 AROUND 必然 | ❌ |
AROUND (3) 华为 必然 | ❌ |
将各种搜索指令进行合理的组合,就可以实现更精准的搜索。当然这其中要需要注意避免一 些无效的组合。
小虫子是一个天文爱好者,最近在做有关地外探索的史料研究。今天他想在网上找一些有关 阿波罗号飞船的 PDF 文档来看,那么应该如何搜索呢?
小虫子要找的是权威信息,可以去美国宇航局的官网呀!所以进行以下尝试 ——
Google 搜索:apollo site:nasa.gov apollo filetype:pdf
![2019.4.20 - Google 搜索截屏]
(https://course.chongbuluo.com/.gitbook/assets/image%20%28159%29.png)
示例 | 备注 | 原因 |
---|---|---|
filetype:doc filetype:pdf | ❌ | 不能同时搜索两种文档格式 |
filetype:doc OR filetype:pdf | ✅ | |
site:gov site:com | ❌ | 不能同时搜索两个域 / 域名 |
site:gov OR site:com | ✅ |
索引搜索(Index Search)可以为我们呈现网站的文件目录,即资源列表。文件目录不 是网页,天然对搜索引擎「不够友好」,所以我们在常规搜索中一般不会检索到此种结果。 正因如此,无数的文件资源沉睡在服务器中。那么我们是否有办法将其挖掘出来呢? 当然!虫部落・快搜 - 索引搜索即是利用了更 为复杂的搜索指令,它由 Google 搜索驱动。以下是借助搜索指令的代码片段:
function search() {
let type = button.innerText;
let query = searchBox.value;
let commonToAll = `
-inurl:(jsp|pl|php|html|aspx|htm|cf|shtml)
-inurl:(index_of|listen77|mp3raid|mp3toss|mp3drug|index_of|wallywashis)
intitle:\"index.of./\"
`;
const extensions = {
'视频': '(avi|mkv|mov|mp4|mpg|wmv)',
'音频': '(ac3|flac|m4a|mp3|ogg|wav|wma)',
'电子书': '(CBZ|CBR|CHM|DOC|DOCX|EPUB|MOBI|ODT|PDF|RTF|txt)',
'图片': '(bmp|gif|jpg|png|psd|tif|tiff)',
'软件/游戏': '(apk|exe|iso|rar|tar|zip)',
'压缩包': '(apk|exe|iso|rar|tar|zip|7z)'
}
左侧下拉菜单中选中电子书,搜索:世界名著
,结果喜人。
点进任一搜索结果([结果一链接]
(https://downloads.freemdict.com/Books/Kindle%E4%BA%BA%E5%85%A8%E7%AB
%99/%E5%90%88%E8%BE%91/%E7%AC%AC%E4%BA%8C%E9%83%A8%E5%88%8
6/);[结果二链接]
(http://soft.kuangtengfei.com/ebook/%E3%80%8A%E4%B8%96%E7%95%8C%E5%
90%8D%E8%91%97%E5%90%88%E9%9B%8654%E6%9C%AC%E3%80%8B%E7%BB
%8F%E5%85%B8%E7%8F%8D%E8%97%8F/)),都是以目录结构呈现,点击即可可以
直接下载。
而搜索:
世界名著
的完整 Query 为:intext:"世界名著" (CBZ|CBR|CHM|DOC|DOCX|EPUB|MOBI|ODT|PDF|RTF|txt) -inurl:(jsp|pl|php|html|aspx|htm|cf|shtml) -inurl:(index_of|listen77|mp3raid|mp3toss|mp3drug|index_of|wallywashis) intitle:"index.of./"
。这里面即用到了 intext:
; -
; inurl:
; |
; intitle:
; ""
等八种搜索
指令。
因为这个 Query 已经复杂到无力手动输入,所以借助[虫部落・快搜 - 索引搜索]
(https://search.chongbuluo.com/#index)的傻瓜式输入关键词查询为我们搜索到网络深
层的资源提供了更多可能,同时扩展了各位的搜索技能。
各位还可以尝试更多的关键词,比如
权利的游戏
,以及其英文名 Game of Thrones
等关
键词,结合左侧下拉菜单中的六种选项进行搜索尝试和练习。
Google 高级搜索提供了可视化的输入界面,并且有诸多高级搜索指令没有涉及的功能。借 助高级搜索页面,各位可以缩小复杂搜索查询的搜索结果范围。例如,你可以查找过去 24 小时内更新的网站或浏览黑白图片。
- 语言
- 区域
- 最后更新时间
- 网站或域
- 搜索字词出现在网页上的位置
- 安全搜索
- 阅读水平
- 文件类型
- 使用权限(查找您有权限使用的页面)
- 尺寸
- 宽高比
- 颜色
- 类型(脸部特写、动画等)
- 网站或域名
- 文件类型
- 安全搜索
- 使用权限(查找您有权使用的图片)
我喜欢看球,并且对建筑很感兴趣。所以每次看到欧洲一些豪门俱乐部的球场时就忍不住流
口水 � 下图是巴黎圣日耳曼队的主场 —— 王子公园球场(Parc des Princes)。
接下来这个视角中,不远处的埃菲尔铁塔可谓鹤立鸡群。画面右侧同样高高耸立的这栋黑色
建筑 —— 蒙帕纳斯大厦建于 1972 年,共 59 层,高 210 米,是巴黎市区除埃菲尔铁塔外
最高的建筑,也是市区唯一的一座摩天大楼。
![图源:巴黎圣日耳曼俱乐部官网]
(https://course.chongbuluo.com/.gitbook/assets/image%20%28253%29.png)
三者的二维相对位置如图,三点围成一个三角形。
请问:此三角形的面积是否大于世界五大宫殿(北京故宫、法国凡尔赛宫、英国白金汉
宫、美国白宫、俄罗斯克里姆林宫)的面积总和?
在 Google 地图中搜索三处建筑的名称,标记坐标后,再利用地图的标尺工具对三边进行测 量。 如何分别在电脑、Android、iPhone 和 iPad 版的 Google 地图中进行距离测量,请参 照:[测量点与点之间的距离] (https://support.google.com/maps/answer/1628031?co=GENIE.Platform%3DDeskt op&oco=1&hl=zh-Hans)。
下面引用并补充虫友 @[木落]
(https://www.chongbuluo.com/home.php?mod=space&uid=4283) 的回答作为参
考。
首先,搜索得出故宫面积 72 万㎡,法国凡尔赛宫 111 万㎡,英国白金汉宫面积 18 万㎡,
美国白宫面积 5100㎡,俄罗斯克里姆林宫面积 27.5 万㎡,合计 229 万㎡;
然后,通过 Google 地图搜索并标记三个建筑的坐标,测量三边距离分别为 3.54k㎡、
2.66k㎡、5.09k㎡,利用海伦公式!
[img](https://ss0.baidu.com/6ONWsjip0QIZ8tyhnq/it/u=3652749987,823871558&f
m=58),计算得出三角形面积为 444 万㎡;
最后,做出比较,229 < 444。综上,三角形面积大于世界五大宫殿面积之和。
细心的虫友可能看到了,上图中同时给出了三角形的面积和周长。即用 Google 地图的测距
工具标记形成的如果是一个闭合的几何图形,Google 地图还会计算出该图形的面积。而经
测试,国内的几个地图应用目前尚无此功能。
印度男孩 Saroo Brierley 在 5 岁时迷失了。25 年后,他通过 Google Earth 找到了回家的 路。
我在车站的公园长椅上睡着了。当我醒来时,我的兄弟 Guddu 不见了踪影。附近的一个 平台上有一列火车,门是打开的,所以我徘徊寻找 Guddu。火车上的座位比较舒服,所以 我坐下来了。我一定是睡着了。当我醒来时,火车正在移动,我被困其中,朝着一个未知的 目的地驶去。
——Saroo Brierley
在 Google earth 中感受:[Searching for home](https://earth.google.com/web/@22.581893,88.342451,12.34461998a,4302.2 0311358d,35y,0h,0t,0r/data=CjgSNhIgMDNkNjViNjYxZTFhMTFlN2JmODI5MzFjNjBi MmI2NzkiBGxvc3QaDEZpbmRpbmcgSG9tZQ?hl=en) ![相隔25年后,萨鲁回到母亲身边] (https://course.chongbuluo.com/.gitbook/assets/image%20%28126%29.png)
片源 | 价格 |
---|---|
[腾讯视频] | |
(https://www.douban.com/link2/?url=http%3A%2F%2Fv.qq.com%2Fx%2Fcover%2Fl | |
anev22p4t6mych.html%3Fptag%3Ddouban.movie&subtype=1&type=online-video) | |
免费 | |
[爱奇艺视频] | |
(https://www.douban.com/link2/?url=http%3A%2F%2Fwww.iqiyi.com%2Fv_19rr7pf | |
8fo.html%3Fvfm%3Dm_331_dbdy&subtype=9&type=online-video) | 免费 |
[优酷视频] | |
(https://www.douban.com/link2/?url=http%3A%2F%2Fv.youku.com%2Fv_show%2F | |
id_XMjk1NTcwMjU5Mg%3D%3D.html%3Ftpa%3DdW5pb25faWQ9MzAwMDA4XzE | |
wMDAwMl8wMl8wMQ%26refer%3Ddoubanneirongshuchu_bd.xuyang01_douban_ | |
201122&subtype=3&type=online-video) | 免费 |
YouTube | $2.99 |
Google 图片搜索是在 2001 年 7 月 12 日推出的,2011 年 6 月,它增加了反向图像搜 索功能。 美国唱片艺术家和女演员 Jennifer Lopez 在 2000 年 2 月 23 日举行的第 42 届格莱美奖 颁奖典礼上穿着异域绿色 Versace 真丝雪纺连衣裙。纯粹的面料印有热带叶子和竹子图 案,剪裁的领口非常低远远超过洛佩兹的肚脐,而礼服的腰部则镶嵌着黄水仙。 这件服装立即获得了全球媒体的广泛报道,并且与 Elizabeth Hurley 的黑色 Versace 连衣 裙一起被引用作为最受瞩目的连衣裙之一,这使得设计师 Versace(范思哲)成为家喻户晓 的名字。 ![ Jennifer Lopez 的绿色连衣裙] (https://course.chongbuluo.com/.gitbook/assets/image%20%2813%29.png) 而这件衣服的大量居然成为了创建 Google 图片搜索的动力!因为在 2000 年,Google 搜 索结果仅限于带有链接的简单文本页面,但开发人员正在努力进一步开发,实现了图像搜索 需要回答他们迄今为止看到的最流行的搜索查询:Jennifer Lopez's green dress。因此, Google 图像搜索诞生了。
通过提交图像作为查询进行搜索。结果可能包括类似的图像,网页结果,带有图像的页面, 以及图像的不同分辨率。
- 分析图像:分析提交的图像以查找颜色,点,线和纹理等标识符。
- 生成查询:图像的这些不同特征用于生成搜索查询。
- 匹配图片:查询与 Google 后端的图片进行匹配。
- 返回结果:Google 的搜索和匹配算法会将匹配和视觉上相似的图像作为结果返回给 用户。
- 上传本地图片。
- 拖拽本地或网页图片到搜索框。
- 在搜索框输入图片链接。
- 相似图片。
- 包含这些图像的网站。
- 用户搜索的图片的其他大小。 用户在搜索中上传的图片可能会被 Google 存储 7 天。但是它们不会成为其搜索历史的一 部分,Google 承诺只会在此期间使用它们来改善其产品和服务。 更多有关反向图像搜索的内容,参见:反向图像搜索
这是虫友 @srs 在虫部落社区求助的问题:[【搜索无果】请虫友帮忙找一张照片的来源套图] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=2891)。
偶然看见的一张图,是尔科亚和托尔的 cosplay。想找她们这次拍摄的整套图。因为看起 来是去外景而不是漫展,所以应该会有拍摄一套高清的照片的。
用百度识图只找到和这张图片完全一样的,并没有相关套图,所以过来求助一下下。
可能各位最先想到的就是利用图片逆向搜索了,据说用百度识图的结果惨不忍睹。不过针对
具体的问题,我们看到提问者也给了一些重要的文字信息:尔科亚和托尔的 cosplay
;当
然还包括图片中的文字信息:龙奶当然是非常香浓可口的啦
我最新试了下关键词搜索,很快得到了满意的结果。Google 搜索:龙奶 尔科亚 托尔 cosplay
点击视频结果进入,还可以在右侧的「相关推荐」中看到更多。视频也是高清的画质,更好
地满足了提问者找套图的诉求。
尽管我对二次元、cosplay 完全陌生且毫无兴趣,但在搜索过程中我还确认了一点:尔科亚
和托尔是番剧《小林家的龙女仆》的角色名称,而问题中提到:
因为看起来是去外景而不是漫展,所以应该会有拍摄一套高清的照片的。 所以如果找到图中两位角色的扮演者的真实姓名或者艺名,那么通过关键词搜索应当都比较 容易找到套图或 MV。一般这时候,在视频或者类似微博这样的社交平台的讨论区或者相关 推荐中多翻一翻,往往能够找出点蛛丝马迹。我即是在视频播放页面的右侧「相关推荐」中 获知 柳侑绮与夏美酱 这个信息点。再试试 Google 搜索:
柳侑绮 夏美酱 cosplay 龙 奶
![]()
接下来再试试 Google 的图片逆向搜索:
虽然图片是匹配到了,但是结果中都是同一张图,并且你看 ——Google 提示的可能的相 关搜索是
girl
。说明这次搜索仅仅是在图像特征层面成功匹配,但在语义分析层面,还不 够精确。当然我们能做的就是继续给 Google 以足够多的提示:这样一点小周折之后,也得到了和单纯使用关键词搜索一样的结果。当然,回过头来看,对 于二次元、cosplay 类型的内容,bilibili 等垂直类网站可能是更好的搜索引擎。 使用 Google 逆向图片搜索时,对于语义分析的匹配程度不够精细的情况,适当地用你掌握 的图片相关信息替换掉搜索引擎的关键词(如本案例中的 girl),将有助于搜索引擎展示更 多结果。 当然本案例用于说明这一点还不够典型,后面在专题章节我还会举例说明。
Google 学术搜索提供了一种广泛搜索
学术文献的简单方法。从一个地方,您可以搜索学术出版社,专业协会,在线知识库,大学
和其他网站的许多学科和来源:文章,论文,书籍,摘要和法院意见。Google 学术搜索可
以帮助您找到学术研究领域的相关工作。
- 从一个方便的地方搜索所有学术文献;
- 探索相关作品,引文,作者和出版物;
- 通过库或 Web 查找完整的文档;
- 跟上任何研究领域的最新发展;
- 检查谁引用您的出版物,创建公共作者个人资料。
![一个典型的 Google 学术搜索结果] (https://course.chongbuluo.com/.gitbook/assets/image%20%28194%29.png)
在 Google 学术搜索中,绿色文本不显示网址,而是显示文档的元数据。例如:作者、出版 时间以及出版的网站 / 期刊。
如果你点击 Cite ,Google 学术搜索会自动将文章格式化为参考书目的引文。Google 学术搜索还可以将引文导入参考书目管理器。要调整参考书目管理器设置,请在 设置页面 中 选择你喜欢的参考文献格式,然 后在「参考书目管理器」部分中选择。Google 目前支持 BibTeX、EndNote、 RefMan 和 RefWorks。保存设置后,Google 会为每个结果添加导入链接。单击要保存的 结果的链接。 如果你选中「请记住我的参考书目管理器并在结果页面上显示导入链接」 的引用链接上的框,Google 学术搜索将显示导入结果页面上的链接以便于访问的选项。 ![引文弹出界面] (https://course.chongbuluo.com/.gitbook/assets/image%20%28245%29.png)
单击「 引用者」 可以转到 Google 学术搜索引用此文档的 Google 学术搜索中的所有 文档列表。
要查看与你刚刚找到的文章类似的文章,单击「相关文章」即可;查找此文章的其他版 本,单击「所有版本」(All * versions)。
Chrome 插件:[Google Scholar Button](https://chrome.google.com/webstore/detail/google-scholar-button/ldipcb paocekfooobnbcddclnhejkcpn?hl=en)
在 Google 图书上,您可以阅读书籍和杂志,下载,引用它们并进行翻译。有些书籍由出版
商提供,而其他书籍则作为图书馆计划的一部分进行扫描。
Google 图书计划一直受到欢迎,因为它有可能提供前所未有的机会,成为最大的人类知识
在线机构,并促进知识的自由普及。然而,它也因潜在的侵犯版权而被批评,并且没有编辑
来纠正 OCR 过程中引入扫描文本的许多错误。
图书馆计划是 Google 努力使信息更容易查找的重要组成部分 。通过与图书馆合作,
对来自其馆藏的书籍进行数字化,其目标是建立一个在线可搜索的世界书籍目录。图书馆计
划使用户可以通过 Google 搜索数以百万计的书籍,这些图书以许多不同语言编写,包括罕
见,绝版或图书馆系统外通常无法使用的图书。
对于 Google 图书搜索的使用包括搜索、下载和引用等。
对于一般性搜索,使用关键字查询将提供相关书籍列表。Google 图书会将关键字与图书的 书目信息(例如标题,作者等)及其全文进行匹配;要获得更精确的搜索,例如当你只想查 找标题与关键字匹配的图书时,可使用[高级搜索] (http://www.google.com/advanced_book_search),然后在相应字段(标题,作者,日 期等)中输入你要搜索的内容。
你可以免费下载一些书籍和杂志,以便日后阅读或打印。
- 在左上角,指向电子书 - 免费。
- 在「下载」旁边,点击 PDF 或 EPUB。 如果你没有看到 “电子书 - 免费”,则需要购买。
- 在左侧,单击 “ 关于本书”。
- 向下滚动到「书目信息」。你将看到可用于引用该书的信息。 ![书目信息] (https://course.chongbuluo.com/.gitbook/assets/image%20%28145%29.png)
Google Ngram Viewer 是以图表的形式呈现任何一组用逗号分隔的关键词的频率的在线搜 索引擎,它是 Google Research 的一个项目分支。 地址:Google Ngram Viewer - Google Books
Google 的两位创始人在斯坦福读书时都在数字图书馆项目里干过活。早在 2002 年,谷歌 还没出大名时,就启动了 Google Print 项目,旨在通过扫描建立数据库,把全世界的数字 图书馆项目统一起来。后来因为版权官司,Google Print 项目改名为 Google Books,在 Google Books 中,版权已过期的书全部公开,版权没过期但得到授权的可通过「预览」( Preview)功能部分地公开。 到 2010 年,Google 已经扫了一千五百万册书,这时 Google 决定将已经扫过的书的某些 统计结果公开,这就是 Google Books Ngrams。Ngrams 是在文本中统计词频的算法。 也就是说,书的内容不一定公开,但关于书的词频统计结果可以公开,并且 Google 为 Ngrams 做了一个「显示器」(Viewer),它可以画出输入的任何词或词组的词频统计 结果,即 Google Ngram Viewer 。
我想比较下 19 世纪法国两位著名的浪漫主义文学作家 —— 雨果(Victor Hugo)和大仲
马(Alexandre Dumas)在英文图书作品中出现的频率以及随时间的变化。
在 Google Books Ngram Viewer 中输入:Victor Hugo,Alexandre Dumas
![搜索结果]
(https://course.chongbuluo.com/.gitbook/assets/image%20%28115%29.png)
可以看出雨果的词频整体是高于大仲马的。而图表下方的 Search in Google Books 则
为我们提供了与两位大作家名字完全匹配的不同时期的作品集:
![引述的著作中有词频统计和定位]
(https://course.chongbuluo.com/.gitbook/assets/image%20%28179%29.png)
上世纪六十年代美国黑人民权运动爆发之前,黑人普遍被歧视地称为「黑鬼」(nigger),
随后则被称为「黑人」。而近年来,「非裔美国人」变成更为政 Z 正确的叫法。在 Ngram
Viewer 里输入 nigger,black people,African-American
,可以清晰地看到这一趋势。
![可见历史正在逐渐消灭种族歧视]
(https://course.chongbuluo.com/.gitbook/assets/image%20%2849%29.png)
各位有兴趣的可以自己尝试一些词频研究。比如中国文坛的大佬们的座次,迅哥、巴金、老
舍以及得了诺贝尔文学奖的莫言,看看谁的地位更高一些。
Google 专利搜索(英语:Google Patents)是 Google 公司旗下的一个专业进行专利 和专利申请搜索的搜索引擎,数据来自美国专利及商标局(USPTO)。美国专利及商标局 原始数据库下的 700 万专利数据被投放于此。Google 使用光学字符识别技术使专利页面 被识别。 这项服务于 2006 年 12 月 14 日推出,Google 称该服务和 Google 图书使用的技术相 同。图片使用 PNG 格式存储,并可以使用绘图程序转换。 ![Google Patents 主页界面] (https://course.chongbuluo.com/.gitbook/assets/image%20%28122%29.png)
Google 专利包括来自全球 100 多个专利局的 1.2 亿多个专利出版物,以及 Google Scholar 和 Google Books 中索引的更多技术文档和书籍,以及来自 Prior Art Archive 的 文档。
Google 专利目前索引以下专利局的全文文件:
- 美国
- 欧洲
- 日本
- 中国
- 韩国
- WIPO
- 俄国
- 德国
- 英国
- 加拿大
- 法国
- 西班牙
- 比利时
- 丹麦
- 芬兰
- 卢森堡
- 荷兰人
- 奥地利
- 澳大利亚
- 巴西
- 瑞士
- 台湾 非英文文本的专利也已经机器翻译成英文并编入索引,因此用户只需使用英文关键字即可搜 索专利出版物。
创新性的想法通常作为专利申请或在学术期刊上发表。如果你正在寻找专利申请的现有技 术,那么在许多领域中寻找非专利文献以获得对现有技术的完整视图是至关重要的。 为了使现有技术搜索更容易,Google Patents 包括 Google 学术搜索和 Google 图书索引 的技术文档和书籍的副本。这些文件使用专利检索中常用的合作专利分类方案进行机器分 类,以使查找文件更容易。 在现有技术档案项目包括来自世界各地的公司的老产 品手册和公告。这些文档也在 Google 专利中编入索引并进行机器分类。
在主页上,您可以通过以下几种方式开始搜索:
- 输入专利出版物或申请号,如
[US9014905B1]
,[9014905]
或[US 14/166,502]
- 输入自由格式文本,例如
[autonomous vehicle camera]
- 您还可以输入
["exact phrases"]
和元数据的限制[assignee:"Google Inc"]
,[inventor:page]
和[before:2001]
。 - 注意:必须使用前缀输入发明人和受让人姓名。
- 如果您正在寻找现有技术,请选中 “包括非专利文献” 框以包含 Google 学术搜索的结 果。
- 粘贴大块文本(例如段落)以运行 Prior Art Finder 关键字提取器以建议搜索词。 开始搜索后,搜索查询将显示在页面左侧。“搜索字词” 部分包含与专利标题,摘要,声 明和说明以及学术文档的全文以及 CPC 代码相匹配的文本关键字。每个搜索词和搜索字段 框都是 AND,并且您可以通过单击现有查询词右侧的框内的每个词来添加 OR。更改查询 后,单击远离框或按 ENTER 键执行搜索。
- 在 主页上 ,在搜索框中输入一个或多个关键字。每个单词都是 AND。按 ENTER 进行搜索。
- 您可以输入搜索 CPC 代码
[cpc:A01B]
- 您的搜索查询现在显示在屏幕左上方的 “搜索字词” 下方,或显示在较低屏幕分辨率的 屏幕顶部。如果查询位于顶部,请单击一次以将其展开以进行编辑。
- 要添加其他 AND 条件,请在 “+ 搜索字词或 CPC” 框中输入新短语。
- 要添加 OR 条件,请通过单击 “+ 同义词” 输入要在其中一个现有搜索词右侧进行 OR 运算的词组。
- 要按 CPC 代码进行搜索,请输入与输入关键字词组相同的代码,作为 AND 或 OR 条 件。搜索 CPC 代码包括所有子代码。CPC 代码可以与同一搜索字词框中的关键字结合使 用。
- 按 ENTER 键或单击 “搜索词条” 输入框以执行更新的查询。 关键字可以引用为 “精确搜索”,关键字和每次点击费用可以在前面加上减号。关键字会 自动生成,并包含密切的同义词。 为了使用键盘更快地查询输入,按 TAB 将添加新的同义词,按 ENTER 将添加新的搜索词 框。箭头键和 TAB / SHIFT + TAB 也可以在框之间导航。 “搜索字词” 部分通过对搜索查询进行机器分类,为 CPC 代码提供自动填充建议。在确定 建议时,在同一框中给予更多权重。您可以通过键入关键字来优化建议,在分类过程中将为 其分配更高的权重。如果您开始输入 CPC 代码,则分类建议仅限于具有该前缀的代码。
- 转到高级搜索(主页上不提供布尔条目)
- 在左侧的 “搜索字词” 框中输入您的查询
布尔语法(USPTO 或 EPO 格式):对于更复杂的搜索,支持完整的布尔逻辑。默认运
算符
AND
具有左关联性。 注意: 此方法safety OR seat belt
被搜索为(safety OR seat) AND belt
。每个单词自动包含复数和紧密同义词,并且也可以在没有特殊语法的情 况下使用 CPC(safety belt) OR B60R22/00
。隐式地并在一起的相邻单词(例如(safety belt)
,)在生成同义词时被视为短语。 邻近度:如果文档的表达式包含彼此靠近的表达式,则可以使用邻近度运算符来提高文 档的分数。 注意:邻近运算符仅更改排名,而不是检索。NEAR
,NEARx
,NEAR/x
,或/xw
意味着匹配是最大的x
单词之外,在 任何 顺序。WITH
意味着 20 个字,任 何顺序,SAME
意味着 200 字以内,任何顺序。AJD
,AJDx
,ADJ/x
,或+xw
是 相同的NEAR
,但匹配必须在 相同的 顺序。 示例:(safety ADJ/5 belt) NEAR/10 (baby OR child) SAME vehicle
。 搜索标题,摘要,声明,CPC:您可以使用字段名称在特定字段内搜索。使用TI=(safety belt)
在标题进行搜索,AB=
为抽象和CL=
权利要求书。对于每次点击费 用,CPC=B60R22
文档会与此 CPCCPC=B60R22/low
匹配,将文档与此每次点击费用 匹配 或此 CPC 的子级别。也可以在没有字段前缀的情况下使用每次点击费用(请参阅上面 的按关键字和分类搜索)。 通配符,截断:虽然我们自动生成复数,但您可以指定要搜索的单词的通配符模式。通 配符仅适用于单个单词。前 25 个最常见的匹配将一起进行 OR 运算。 注意: 通配符仅适 用于英语单词。通配符是?
(零个或一个字符),*
或$
(零个或多个字符),$x
(零到 x 个字符)和#
(恰好一个字符)。每个单词可以包含多个通配符。示例:*saccharide?
和hydroxy*phenyl*
。
- 在 主页上 ,输入以下字段名称之一(不带 [方括号])。键入后按 ENTER 键进行搜索:
- 搜索发明者
[inventor:bell]
或[inventor:"Alexander Graham Bell"]
- 搜索受让人
[assignee:google]
或[assignee:"Google Inc"]
- 前或申请日(可以在搜索后改变优先级或出版日期)后搜索
[before:2010]
,[after:"Jan 2006"]
,[before:"1/2/2006"]
- 按国家搜索专利
[country:US]
- 按状态搜索专利
[status:grant]
- 按语言搜索专利
[language:english]
- 要添加新的元数据搜索限制,请单击左侧 “搜索字段” 部分中的框,或者在屏幕分辨率 较低的屏幕顶部。如果查询位于顶部,请单击一次以将其展开以进行编辑。通过展开 “更 多” 菜单可以找到其他字段。
- 许多字段支持多个输入。要在元数据字段中输入其他 AND 或 OR,请单击现有查询右侧 框内的字段名称,例如 “+ Inventor”。
- 按 ENTER 键或单击 “搜索字段” 输入框以执行更新的查询。
发明人和受让人字段提供自动完成建议。您可以键入任何单词的前缀,或多个前缀 “univ
ca” - >“加利福尼亚大学的董事会”。
关键字,发明者和受让人可以通过在开头添加减号来排除 / 注释,例如
[-shovel]
,可以通 过在短语周围添加引号来搜索确切的短语,例如["drag line"]
。 可以通过单击搜索字段框中带下划线的日期类型来更改日期搜索(归档,优先级,发布)之 前和之后的字段。 在使用非专利文献进行搜索时,之前,之后,发明人和 CPC 字段在专利和学术搜索结果中 有效。
- 在主页上输入专利出版物或申请号。该号码可以选择包括国家代码和种类代码。请参阅以 下示例:
US9014905
US 9,014,905 B1
9014905
US 14/166,502
- 匹配列表将显示在下拉菜单中。使用箭头键导航并按 ENTER 或单击以直接转到结果。
点击搜索结果时,您将获得专利结果或非专利结果摘要。
专利结果包含全文,数字,原始 PDF 版本,元数据和引文。
对于查看图形,I
键切换整个图像显示面板, A
而 D
键和键可以前后导航图像。W
和
S
键旋转当前的图像。如果屏幕足够宽,则数字显示在右侧,如果屏幕较窄,则显示在描
述之上。
![李彦宏在美国申请的「超链分析」专利]
(https://course.chongbuluo.com/.gitbook/assets/image%20%28135%29.png)
非专利结果包含原始文档的片段,文档的链接和元数据。通常可以在元数据部分中找到指向 全文的链接「查看 PDF」或「查看 HTML」。
- Google 专利搜索
- Google 专利高级搜索 ![Google Patents 高级搜索主页界面] (https://course.chongbuluo.com/.gitbook/assets/image%20%28221%29.png)
下图是 Google 申请的一项用于手机的图形用户界面专利,对于外观设计的功能描述:在长
方形中输入文字,使用者可以选择用于声音搜索的麦克风图标和用于图像搜索的照相机图
标,这些图标分别激活输入机制以接受音频和图像数据。放大镜图标用于提交要搜索的质
询。
其实说直白点儿,即是搜索框部分的 UI 是受专利保护的,这个界面是不可模仿抄袭的!
请问:这项专利的发明人 / 设计人是谁?以及此专利在中国的申请日是什么时候?
垂直领域的信息搜索:首先想到其所在领域的专业搜索引擎。即便你不了解,也可以通过 Google 关键词「专利搜索引擎」来获取。
这里引用并补充社区虫友 @[金秋山雨林] (https://www.chongbuluo.com/home.php?mod=space&uid=6301) 的解答作为参 考:
发明(设计)人 :A・赛卡 申请日:2017.05.16
专利搜索,比较有针对性,首先相到的是用一些专利搜索引擎。以前使用过收藏的有: 广东大数据、Soopat、佰腾、润桐、大为,以及 Google patents,当然还有国知局的官方 查询系统(但不太推荐)。
对于虫子的问题,首先需要确定关键词。我首先希望尽量扩大搜索范围,避免关键词不准 确遗漏导致搜不出来。 故首先用关键词 “google 搜索”,在大为中进行搜索(因为大为 是我目前感觉相对最全的),结果出来 438 条,明显太多,说明搜索范围太大。
然后改用关键词 “google 搜索 界面”,出来 37 条,结果没有我想要的,说明关键词不 对,搜索失效。
仔细一想,这个专利中有代表性的关键词应该是 “麦克风” 或 “放大镜” 两个特征, 于是改用关键词” 谷歌 放大镜 “出来唯一一条,就是题目的答案。 为了验证,在其他几 个专利搜索引擎广东大数据、Soopat、佰腾、润桐中输入同样的关键词” 谷歌 放大镜 “,出来的都是这个专利。(但广东大数据需要在中间加上 and 才搜的出来)
总结:关键词很重要。当然深究的话,语法也同样重要。
借虫子这个帖,分享一下对以上提到的专利搜索引擎的一些总结,(PS:我只是个搜索 小白,并不是专业的专利审查员大大……)
1、广东大数据。把这个放在第一位,是因为感觉这个最友好。优点:比较新、全(最新 的没预览但可以下载);可批量下载原文,一天最多下载 100 条。
缺点:浏览检索结果时的图片较小不太方便观看;有时不知为何网页响应很慢。
2、Soopat。这个应该广为所知。优点:专利浏览时的附图比较全、清晰;下载的 PDF 原文很清晰。
缺点:对于不是会员的很不友好,总是需要输入验证码;最新公开的专利不太全,稍 微慢几天;批量下载等高级功能需要收费。
3、佰腾。优点:高级检索可视化不错;预览看起来很舒服;搜索国外的专利较方便;权 利要求预览有层级视图很人性化。 缺点:最新公开的不全;单个下载要输入验证码,批量 下载要收费。
4、润桐。优点:专利更新比较快(粗略对比);下载免费,一次好像能下载 10 条。
缺点:专利不是特别全;最新的无法下载;批量浏览不方便,没有首图模式。
5、大为。优点:最新、最全(不完全对比);显示界面很不错;最新公开的有图;下载 比较方便。
另外,根据分类号反查很方便,以及专利权转让后可通过公司名称查到,这两个功能很 赞。
缺点:不是 VIP 会员的话,浏览、下载次数有限制。
6、谷歌专利。搜出来的专利数量最多,可能是因为包含了国外的,但缺少少量最新公开 的专利;浏览、下载方便,但分类筛选功能好像不太行;可直接翻译成英文(貌似是机器翻 译);可推荐关键词和类似文件、引用文件,这个很赞。
备注:以上的对比结论只是针对我搜过的某些内容,并不一定对所有情况都适用,需 要自行对比。对于不同的需求,侧重点不同,以上孰优孰劣需要自行判断。对于需要申请专 利的企业或技术人员,比较关注同行业领域最新的专利进展,因此搜索出来的是否新、全面 很重要。 我以同样的某公司名为关键词进行搜索,出来的数量如下(包含发明、实用新 型、外观、发明授权,但不包含其国际专利): 第一天:广东大数据 1926,Soopat 1921 ,佰腾 1795,润桐 1917; 第三天:广东大数据 1926,Soopat 1927,佰腾 1802,润桐 1917,大为 1948; 第四天:广东大数据 1932,Soopat 1933,佰腾 1802,润桐 1917 ,大为 1948; 第五天:广东大数据 1932,Soopat 1933,佰腾 1808,润桐 1917,大为 1954,谷歌 1986。 (备注:数量的微小差异可能是各个搜索引擎对关键词的匹配不一致 导致) 可以看出,这些搜索引擎的更新周期或时段是不一致的,哪个更好,请自行分析。
至于精准搜索,需要准确合理的关键词,以及合理的语法,逐步尝试,筛选。这就比较复 杂了,需要经验和时间。 针对某个细小研究领域我的建议是采用关键词 + 分类号的方式在 高级检索中用表达式进行搜索,会比较准确(注意不同的搜索引擎语法不一样)。
以上只是一家之言,更多的经验和建议,希望有虫友能总结相关经验,互相分享!更希望 有厉害的专利审查员大大能出来传授经验,不胜感激! 专利搜索,对于我们普通用户而言,首推还是 Google patents。无论是检全率、检准率都 比较理想。
利用 Google 数据集搜索工具,你可以通
过简单的关键字搜索来查找整个网络中存储的数据集。该工具可搜索有关整个网络上数以千
计的存储区中托管的数据集的信息,从而让这些数据集可供大众使用,让人人受益。
开发团队相信,这个项目还能够带来下列好处:a) 形成数据共享生态系统,鼓励数据发布
者依照最佳做法来存储和发布数据;b) 为科学家提供相应平台,方便大众引用他们创建的
数据集,展现他们的研究成果所带来的影响力。
随着越来越多的数据集存储区使用 [schema.org 及类似标准]
(https://developers.google.com/search/docs/data-types/dataset)来描述数据集,用户
能在数据集搜索工具中查找的数据集的种类和覆盖率也将持续增加。
| 关键词 | 描述 | | ------------------------------------------------------------ | -------------------------------- | | [weather site:noaa.gov](https://toolbox.google.com/datasetsearch/search?query=weather%2 0site%3Anoaa.gov&docid=d6o2TyCeUrQqhJUyAAAAAA%3D%3D) | NOAA 站内气候 相关数据集 | | [boston education data](https://toolbox.google.com/datasetsearch/search?query=boston%20educatio n%20data&docid=oIPyomFVn3RQCxDDAAAAAA%3D%3D) | 波士顿教育数据集 | | [population of chengdu in China](https://toolbox.google.com/datasetsearch/search?query=population%20of %20chengdu%20in%20China&docid=t%2BZGFf1Th6D1z1WgAAAAAA%3D%3D) | 成都人口数据集 | | [中国旅游] (https://toolbox.google.com/datasetsearch/search?query=%E4%B8%AD%E5%9B% BD%E6%97%85%E6%B8%B8) | 中文搜索结果相对较少 | | [重庆气温] (https://toolbox.google.com/datasetsearch/search?query=%E9%87%8D%E5%BA%8 6%E6%B0%94%E6%B8%A9&docid=g5tzYe822WfBsnM2AAAAAA%3D%3D) | 中文 搜索结果相对较少 | | [machine learning](https://toolbox.google.com/datasetsearch/search?query=machine%20lea rning) | 寻找机器学习中模型训练所需数据集 |
例如,如果您想分析每日天气记录,可以在数据集搜索中尝试此查询:
你将看到来自 NASA 和 NOAA 的数据,以及来自哈佛大学的 Dataverse 和大学间政治与
社会研究联盟(ICPSR)等学术资料库的数据。
Google 发布了运用「词向量」人工智能技术的搜索引擎 Talk to Books。词向量是一种自然语言处理形式,两 个词向量的差值对应词的关系,词向量的距离则对应词的相关或相似性。对于选定的一组 词,将其向量投影到空间中,词义相近的词向量在向量空间中表现出聚类现象。陈述一件 事或提出一个问题,Talk to Books 就会在书中找出能回答你的句子,这种方法不依赖关键 词匹配。 ![Talk to Books 对话框] (https://course.chongbuluo.com/.gitbook/assets/image%20%28205%29.png) 通过 Talk to Books,Google 提供了一种全新的图书搜索方式。用户陈述一件事或提出一 个问题,它就会在书中找出能与之形成对话的句子,这种方法不依赖关键词匹配,可以帮助 你找到关键词搜索未必找得到的有趣书籍,但是仍有改进空间。 尽管目前的 Talk to Books 可能对于各位来说并没有多大用处,但作为一门力图系统化的教 程,我想有必要和各位一起了解和鉴证 AI 技术之于搜索的改变,对世界永远保持一颗好奇 心。
Talk to Books 可以按照艺术、小说、科学、历史和宗教等十个门类对搜索的图书进行过
滤,点击 Go!
左边的菜单按钮即可。对了!Talk to Books 目前仅支持英文。下面来看几
个样例:
�
[Why did World War I
happen?](https://books.google.com/talktobooks/query?q=Why%20did%20World%
20War%20I%20happen%3F)(截图展示的是 Google 翻译后的页面)
�
[What causes
cancer?](https://books.google.com/talktobooks/query?q=What%20causes%20canc
er%3F)
Google 趋势(英语:Google Trends)是监 控人们关注点变化的一种方式。它可以让你探索人们在查询中使用的关键词,以及人们搜索 特定关键词的次数、地点和时间。Google 趋势为我们提供了一种深入了解人们想法的极好 方式。 ![Google Trends 的人物比较截屏] (https://course.chongbuluo.com/.gitbook/assets/image%20%28244%29.png)
借助 Google 趋势,你可以:
- 查看人们何时提交了很多关于某个主题的查询;
- 发现人们随着时间的推移,提问方式的变化;
- 比较一个主题的两种不同类型的 Query,看看哪一个更常见。 你可以比较:
- 使用不同的关键字;
- 查询来自世界各地的主题;
- 随着时间的推移,观察搜索主题的变化。 这样做可以让你了解人们如何思考某个主题以及你可能选择搜索某个主题的方式。如果你有 关键词 A 和关键词 B,并且你发现 A 比 B 的搜索量多十倍,那么你可能就不想使用后者 了。
| 年份 | 交互式图表
视频主题词 |
---|
------------------------------------------------------------ |
2018 年度热搜榜 |
good |
2017 年度热搜榜 |
how |
2016 年度热搜榜 |
link |
2015 年度热搜榜 |
link |
2014 年度热搜榜 |
link |
2013 年度热搜榜 |
link |
| | 2012 年度热搜榜 | link | / | | 2011 年度热搜榜 | / | / | | 2010 年度热搜榜 | link | / | | 2009 年度热搜榜 | / | 无视频 | | 2008 年度热搜榜 | / | 无视频 | | 2007 年度热搜榜 | / | 无视频 | | 2006 年度热搜榜 | / | 无视频 | | 2005 年度热搜榜 | / | 无视频 | | 2004 年度热搜榜 | / | 无视频 | | 2003 年度热搜榜 | / | 无视频 | | 2002 年度热搜榜 | / | 无视频 | | 2001 年度热搜榜 | / | 无视频 |
- [学习 GOOGLE 趋势课程] (https://newsinitiative.withgoogle.com/training/lessons?tool=Google%20Trends&i mage=trends)
通过 Google Trends 比较两种不同的音乐,hiphop (嘻哈) 和 rap (说唱)。看看它们的 搜索趋势如何。
1.Google 搜索 google trends
并单击链接。
\2. 进行测试搜索,在搜索框中输入 hiphop, rap
。
注意:逗号用于分隔两个术语。与大多数 Google 工具不同,逗号并不代表任何内容,此
处它用于关键词分开。
![两个单词在实际使用中并不像预想的那样彼此接近]
(https://course.chongbuluo.com/.gitbook/assets/image%20%28222%29.png)
我在这里首先注意到的是,我认为会更受欢迎的 hiphop 显示出低使用率。随着时间的推
移,这两个词都是相对不变的, 在过去的几年中,hiphop 这个单词略有下降。
它为什么这么低?
也许它拼写 hiphop 作为一个单词?我想知道使用双字拼写 hip hop 会好一些吗?
![[ hip hop,rap ] 的查询结果则超出预期]
(https://course.chongbuluo.com/.gitbook/assets/image%20%2861%29.png)
由此可见,hip hop 比 hiphop 更广泛地被人们所使用*。*而此数据来自全球范围的统
计,因为 全球 是默认的区域设置。如果我们将区域设置改为美国会怎样?
美国的结果略有不同。 hip hop 和 rap 这两个词在美国的竞争激烈程度远远超过全
球。
\1. 小明计划这周末去曼谷游玩儿,他想看看提前了解下那边有什么活动举办,以及行程安
排,请问如何利用 Google 搜索来帮助他快速搞定这些?
\2. 使用 Google、百度和 Bing 的网页版图片搜索,哪个可以通过搜索工具筛选出背景透明
的图片结果?
Google
百度
Bing
释义:只有网页版 Google & Bing 图片搜索可以筛选背景透明的图片。
3.Google 搜索一直以简洁的 UI 设计著称,但进入移动互联网时代后,信息流成为人们获
取新闻资讯的一个重要渠道。那么,Google 搜索 App 首屏是否有信息流呢?
4.Google 搜索指令 filetype: 可以用来搜索任意一种图片格式的文件吗?
可以
不可以
释义:filetype: 不支持图片格式。
5.Google 曾在搜索页面上线纪念哪吒脑海的 doodle,请问这个涂鸦作品是于哪一天推出
的?
\6. 你能否在 Google 搜索中查询你的搜索结果浏览记录?
7.Google 图书搜索的结果是否全部都只提供预览而非全文查看?
是
否
释义:部分预览和全文可看都有,可以通过搜索工具筛选。
\8. 小虫子想在网上找些鲁迅相关的博客文章,最好是标题中带有「鲁迅」的,请问它该如
何使用 Google 搜索?
9.Google 网页搜索的每一页结果默认显示多少条?
15
10
8
释义:通用搜索引擎的网页版和手机版默认第一页都是显示 10 条结果。百度规定第一页广
告数量不超过 50%,这是个什么画面... 各位自行脑补吧�
\10. 通过 Google 财经搜索可知目前百度的员工数量是多少?
\11. 虫子想要 Google 搜索 2008 年 5 月 12 日那一天有关汶川地震的网页信息,请问在
搜索工具中输入下列哪种时间格式是有效的?
2018.5.20
5/20/2018
2018-5-20
释义:正确的时间输入格式为:月 / 日 / 年。
12.Google 搜索腾讯股价
,结果显示的股票指数是实时的吗?另外,从结果可以看出腾讯
历史股价最高点出现在哪一天?
13.Google 搜索 pornhub
,在搜索结果页面是否可以直接搜索 Pornhub 的站内信息?
是
否
释义:对于流量高且内容丰富的大站,Google 会直接在其搜索结果中置入搜索框。
Pornhub 当然不能例外
\1. 利用 Google Ngram Viewer 分析科学、哲学与宗教在各个时期的史料记载中出现
的频次并得出一些个人观点。
\2. 可能对于一部分人来说,本章 Google 主题的论述就是一个「404 网站的深情召唤」。
如果在你目前的网络条件下,它还是一个 404 网站,那么请通过百度搜索去「大胆发现,
小心验证」,找到一个从价格、材质、长度、可靠程度等各方面都让你能接受的梯子。
\3. 请至少通过 3 种途径(包含 Google 搜索)帮助知乎 ID 为「贤枫 imyzf」这位网友找
回这个已经 404 的 Flash 源文件(格式后缀为 .swf),注意是源文件!
\4. 待更新......(详见再版更新计划)
序号 | 答案 |
---|---|
1 | [活动] |
(https://www.google.com/search?newwindow=1&q=%E6%9B%BC%E8%B0%B7%E5 | |
%8D%B3%E5%B0%86%E4%B8%BE%E5%8A%9E%E7%9A%84%E6%B4%BB%E5%8A | |
%A8&stick=H4sIAAAAAAAAAAFRAK7_CAgSCC9tLzBmbjJnKiVrYzovbG9jYXRpb24vY | |
2l0eXRvd246dXBjb21pbmcgZXZlbnRzogUb5pu86LC35Y2z5bCG5Li-5Yqe55qE5rS75 | |
YqobddavlEAAAA&sa=X&ved=2ahUKEwiHgqjhvuniAhWlFjQIHRkDB_oQri4wGXoEC | |
BEQBw&biw=1920&bih=993);[行程安排] | |
(https://www.google.com/destination?q=%E6%9B%BC%E8%B0%B7&newwindow= | |
1&output=search&dest_mid=/m/0fn2g&sa=X&ved=2ahUKEwiHgqjhvuniAhWlFjQI | |
HRkDB_oQri4wGXoECBEQAw#dest_mid=/m/0fn2g&tcfs=EhIKCC9tLzBmbjJnEgbm | |
m7zosLc)。在知识图谱中。 | |
2 | Google 图片搜索。 |
3 | 有。来自于智能算法推荐。 |
4 | 不能。filetype 不支持图片格式。 |
5 | 2014 年 5 月 30 日。[《哪吒闹海》上映 35 周年] |
(https://www.google.com/doodles/35th-anniversary-of-nezha-conquers-the-drago | |
n-king) | |
6 | 可以。并且个人记录受到 Google 的隐私保护。 |
7 | 否。可以通过搜索工具筛选。 |
8 | Google 新闻搜索,在搜索工具中选择「博客」,Query 为 intitle:鲁迅 |
9 | 10 条。 |
10 | 42,267(以你查到的实时数字为准)。 |
11 | 2。在自定日期范围弹窗中输入日期的格式为:�M/D/Y |
12 | 不是,从免责声明可以看出;2018 年 1 月 26 日。 |
13 | 可以。对于流量高且内容丰富的大站,Google 会直接在其搜索结果中置入搜索框。 |
|
\1. 在 Ngram Viewer 中,分别输入首字母大写的 Science, Philosophy, Religion
,和小
写的 science, philosophy, religion
,我们如下两张图。在[大写的图]
(https://books.google.com/ngrams/graph?content=Science%2C+Philosophy%2C+
Religion&year_start=1800&year_end=2000&corpus=15&smoothing=3&share=&d
irect_url=t1%3B%2CScience%3B%2Cc0%3B.t1%3B%2CPhilosophy%3B%2Cc0%3B.t
1%3B%2CReligion%3B%2Cc0)中,可以清楚看到在公元 1600 到 1800 年间,宗教是压
倒性强势,然后是哲学,相比之下,科学还是没影的事。但 1850 年是转折点,科学慢慢占
据优势,比宗教和哲学加起来都大;在[小写的图]
(https://books.google.com/ngrams/graph?content=science%2C+philosophy%2C+r
eligion&year_start=1800&year_end=2000&corpus=15&smoothing=3&share=&dir
ect_url=t1%3B%2Cscience%3B%2Cc0%3B.t1%3B%2Cphilosophy%3B%2Cc0%3B.t1
%3B%2Creligion%3B%2Cc0)中,科学和宗教的位置互换,晚了一百年。
按照罗素在《西方哲学史》里的打油说法,科学是确定性的知识,神学是不诉诸理性的教 条,而哲学则介于两者之间。 \2. 显然这个问题...... 呃...... 我们还是微信里抽空交流吧。 \3. 详细的过程不在此赘述了,看表格吧 —— | 序 | 过程简述 | | ---- | ------------------------------------------------------------ | | 1 | Google 搜索标题找到知乎网页,获取到失效的链接 http://googlechinablog.com/gugeflash.swf 添加到迅雷下载即可。有兴趣的可以去 了解下原理。 | | 2 | 通过网页时光机 archive.org 访问失效链接的存档,也可以获取到文件。 | | 3 | Google 搜索
谷歌 中文名称由来 flash
或者其它 Query,在虫部落帖子 [Google 映象:为何将中文名取为 “谷歌”?] (https://www.chongbuluo.com/thread-4908-1-1.html)中有源文件的动画展示,保存页 面即可下载到源文件。 | | 4 | 直接 Google 搜索 gugeflash.swf ,可以在第一个结果 https://code.google.com/archive/p/liumengxiao/downloads 中获取到网友备份的 源文件。 | \4. 待更新......
关键词(keyword)伴随着搜索引擎的诞生,一直到今天,它仍是搜索的主要发起形式。
当我们搜索时,首先,搜索引擎算法会在索引中查询我们的搜索关键词以找到适当的网页。 这些算法会分析相关关键字在某个网页上(不论是在标题中还是在正文中)的出现频率和 显示位置。 这其中标题里的关键词权重一般是最高的,其次是正文中的;频率越高,一般匹配度也就越 高。这曾被一些垃圾网站通过堆叠关键词来骗取搜索引擎的流量,但针对这类垃圾信息,搜 索引擎也有了针对性的过滤算法;至于显示的位置,通常是指,如果出现在正文的「摘要」 部分,则权重相对较高。 了解通用搜索引擎的关键词匹配原理,有助于我们提高选择关键词的决策能力。本章节理论 较少,主要通过案例展开。
自从虫部落快搜撤下了那个可以一站式搜索全平台音
乐的疯狂音乐搜之后,就陆续有人来问我网站地址。其实我也没记地址,不过那个搜索器的
程序作者后来将代码开源了。
所以,通过类似关键词组合 音乐 搜索器 多站合一
这样的 Query,你就可以搜到不少将其
部署上线的孪生网站。
- [音乐 搜索器 多站合一 - 百度一下] (https://www.baidu.com/s?ie=UTF-8&wd=%E9%9F%B3%E4%B9%90+%E6%90%9C %E7%B4%A2%E5%99%A8+%E5%A4%9A%E7%AB%99%E5%90%88%E4%B8%80)
- [音乐 搜索器 多站合一 - Google Search](https://www.google.com/search?newwindow=1&hl=en&q=%E9%9F%B3% E4%B9%90+%E6%90%9C%E7%B4%A2%E5%99%A8+%E5%A4%9A%E7%AB%99%E 5%90%88%E4%B8%80) 下面是一个从搜索结果中摘选的不完全清单:
- music.bbbbbb.me
- music.geekglasshouse.top
- music.xiaoyi6.com
- music.cccyun.cc
- www.songe.cc 附:[GitHub - 音乐搜索器 - 多站合一音乐搜索解决方案] (https://github.com/maicong/music) 网络信息,日新月异。信息的网页地址、传播途径以及呈现形式都在发生着变化。特别是对 于稍有热度的信息,往往都不会是一个孤立的点,而总是与其它点有着千丝万缕的联系。我 们通过提取信息 A 本身的属性(音乐、搜索器)和特征(一站式、多站合一)并以此来发 起搜索请求,往往就能找到有关 A 的更多线索,即便 A 已经下线消失,我们也有可能找到 更多它的替代品 B、C、D...
本节重点呈现的是单纯使用关键词来搜索信息的方式方法。通过生动有趣的案例,感受 关键词的能量。
记忆模糊的事物,通过零碎的记忆信息来找寻事物; 以图搜图未果,通过描述图片特征的关键词来搜索;
这是去年被全球网友恶搞的奢侈品牌 GUCCI 的鞋带。这原本是一个梗图,但很多人对如此
昂贵到令人发指的鞋带价格并没有表示出怀疑,只是在叹息「贫穷限制了我的想象力」。毕
竟人家是奢侈品嘛。
说完老梗再回到正题,我用红色的圈标记出鞋带两头末端的部分,请问它叫什么名字?
生活中我们也经常会遇到对于再熟悉不过的事物,我们却叫不上名字的情形。比如你要给别
人描述你鞋带圈红的部分裂开了,怎么说呢?这是一种比较难受但又无伤大雅的微妙感觉。
再比如,你学过的一个成语,你明明知道它的存在并且晓得是什么意思?但话递到舌尖了却
愣是想不起那四个字是啥。尴尬。
我们为此类情况建立一个模型即是:词:释义。我们知道词的意思,但却想不起这
个词。
解答问题的过程有点儿像以图搜图,是反向的。所以我们称之为「反向词典」(Reverse
Dictionary)。
在英语体系里,有专门的反向词典搜索。Google 搜索 Reverse Dictionary
就会出现一
堆。根据我个人的经验,解决中文世界的此类问题,宜用百度 —— 凭借直觉来描述事
物。
对!凭借直觉来描述事物,不要多想,不要觉得自己这么提问是不是有点傻?因为在同
一个母语体系中,人们对于事物的直觉描述是想通相近的。这样的话,搜索引擎甚至都不用
去懂你(understanding query),它只需要匹配出类似甚至高度类似的提问就行了。而这
些提问对于百度而言,就在自家的百度知道里。
绳花指鞋带末端的金属,或者塑料套子。
英文译作 Aglet。有时,翻译会直接翻译成 “鞋带末端的金属或塑料箍”,而不是绳 花。
百度百科 - 绳花 类似的问题还有很多,比如 ——
那么英语世界里是如何解决这类问题呢?其实更容易 —— 反向词典。
还是以上面的「绳花」为例。首先,Google 搜索 [reverse dictionary
](https://www.google.com/search?q=reverse+dictionary&oq=reverse+di
ctionary&aqs=chrome.0.57j60j61j60l2j59.3939&sugexp=chrome,mod=1&sourceid
=chrome&ie=UTF-8),从结果列表中选择一个,比如第一的 OneLook Reverse
Dictionary and Thesaurus。
接下来,在反向字典网站上,输入你要查找的单词的定义或描述。我将 shoelace tips
(
鞋带提示)输入搜索框并选择自动提示的可能答案,如 aglet 。
最后,验证它给你的单词是否正确。很简单!Google 搜索
def aglet
。Google 的搜索结
果将为你提供该单词的定义。
可能需要使用反向字典的原因有很多:
- 当你知道这个词的定义,但不知道或不记得这个词时。
- 当你需要查找术语的特定变体或类似术语的列表时。
- 当你需要搜索单词的同义词以增强搜索效果时。
这是虫子和女友的一段真实对话:
虫子:明天早上把周末买的那个什么菜做了吧,感觉再放就要坏了...
女友:什么菜呀?
虫子:呃... 就是那个有点像竹笋,长得细长的,绿绿的那个...
女友:嗯?... 奥 —— 我知道了,我知道了你说的啥了。
虫子:就是不知道叫啥名字,正想网上搜下那菜的做法呢...
女友:我也不知道叫啥... 不过你可以 Google 拍照搜索下... 说完,女友拎着浴巾去洗澡了。我躺在床上,想着客厅桌子上放的那一把「不知名」的菜。 懒癌如我,难道不拍照识图就搜不出来了?试试! 我用两个关键词组合来描述了这种菜在我脑海中的形态:
长得像竹笋 细长
。Google 图片 搜索: ![注意看右下角] (https://course.chongbuluo.com/.gitbook/assets/wechatimg244.jpeg) ![点击查看,芦笋!✅] (https://course.chongbuluo.com/.gitbook/assets/wechatimg245.jpeg) 诚然,用 Google 图片反向搜索也可以得出结果,但我在此举例,意在强调如何善用关键 词去描述你要搜索的对象。其次,作为对自己搜商的提升,发散式、多样化的方法也是值 得刻意去思考的。
![虫部落 QQ 群里的对话截图]
(https://course.chongbuluo.com/.gitbook/assets/image%20%28204%29.png)
看到不认识的花,或者其它植物,有时会好奇想去认识到底是啥玩意儿。大部分人都有了以
图搜图的意识,谷歌最强、百度次之,当然还有类似
whatanime 这样的专业小众化的图搜引擎。
不过在今天的技术背景下,以图搜图在很多场景下还只是一个美好的愿望,实操性比较差。
目前的图像识别技术基本可以分为两类。通俗讲,一种属于轮廓识别(侧重点),比如淘宝
的拍立淘。注重用包包衣服上的轮廓、线条建立图像模型;另一种侧重颜色、色块分布,比
如花卉识别
。实际应用中,这两种会结合,只是根据应用方向会有所侧重,可能是出于对识别时间成本
的考量吧。
最终还是要和已有的图像数据库匹配,所以一样东西越常见,匹配结果自然会越多。比如牡
丹花;反之则越少甚至没有,比如上面的图例。当然这其中还包含明暗、角度等诸多因素的
影响。
所以潜意识里不应有「识别不出那就没辙了」的轻易放弃的想法 —— 不然怎么对得起你的
好奇心呢~
最后就来简短描述下虫子是如何搜得的 —— 关键词描述。
一开始是:黑色外壳 细长 有籽 植物 的组合,无果;
接下来看到说是云南产的,所以换了个组合:黑色外壳 细长 植物 云南,就 OK 了(通
过图片对照确认是一种中药 —— 神黄豆),如下图:
这其中当然有运气成分,但是不妨碍我们将其作为一种方法论。
网页内容中对植物的外形描述本身就是很常规的表达(百科尤甚),所以当你尝试着把你眼
睛所看转化成精炼的文字描述时,再不断尝试组合,就很有可能找出,往往比以图搜图还见
效。
在 GitHub 的个人主页有个日历一样的版块,每个小方格代表一条,只要提交了代码,当天 的小方格就会变绿,颜色越深,意味着提交的代码越多,即越努力 � 某天,同事在企业微信群里问到:
想问一下 地铁瓷砖都比我努力 的那个梗图 的搜索关键词是啥? 分解这句话得出几个关键词:
地铁
瓷砖
都比我努力
梗
对于问题描述语句的分解,应遵循完整保留最小语义单元的原则。 下面分别展示了在 Google 网页和图片中的搜索结果: ![Google 图片搜索结果] (https://course.chongbuluo.com/.gitbook/assets/image%20%28136%29.png) ![Google 网页搜索结果] (https://course.chongbuluo.com/.gitbook/assets/image%20%28195%29.png) 奇怪的是在网页搜索结果中的图片缩略 list 中出现了我想要的图片,但是在图片搜索中反而 没有呈现,这个逻辑有点迷。所以在小样本的案例无法确信告诉我们哪种选择更容易找到图 片的情况下,兼用网页搜索和图片搜索是最好的策略。 最后再分享一张「洗手间比你也努力」的样子,图源 Reddit - [I think this washroom wins](https://www.reddit.com/r/ProgrammerHumor/comments/4nsbi3/i_think_this_ washroom_wins/)�
很多人因为看了《白日梦想家)(The Secret Life of Walter Mitty)这部电影萌生了去冰 岛旅游的想法。在剧中,男主先后去了去了格陵兰岛、冰岛、尼泊尔和喜马拉雅山脉,但实 际上这部电影只在冰岛取景。 事实上,冰岛已然成为众多导演的理想取景地,比如我最喜欢的一部科幻片《星际穿越》中 的冰冻星球即是在冰岛的冰川取景。 一如我们大多数经历的平凡生活,《白日梦想家》的故事虽然没有白日梦那般奇幻,但也许 是镜头和景致让主题在不断升华吧,是虫子很喜欢的 feel~ 当然还有那美妙的电影原声,在 每一段旅程恰如其分地唱响... 请问:下面两张《白日梦想家》电影原画中的瀑布实景叫什么?(英文名) ![《白日梦想家》剧照] (https://course.chongbuluo.com/.gitbook/assets/image%20%28121%29.png)
因为问题指向电影中的实景,那如果这个瀑布知名度很高的话,可能会在网络文章中有所提
及;反之,通过 Google 街景地图来搜索也是个不错的方法,而这其中会涉及到一点小的技
巧。
而无论是以上哪种,我们都需要先找到与这个瀑布相关的信息,瀑布、公路... 照片所呈现的
之于电影拍摄都是取景,那么通过关键词 白日梦想家 取景
也许就可以获取到一些相关的
网络讨论。
首先,Google / 百度关键词:白日梦想家 取景
可以得知问题截图的瀑布位于冰岛 93 号公路旁,从埃伊尔斯塔济(Egilsstaðir)到塞济斯
菲厄泽(Seyðisfjörður)之间的路程。然后进入谷歌地图搜索,输入起止地点。
这么长一段路程,也是 Google 街景所覆盖的。**有什么特征可以帮助更快确定大致的位
置?**看截图或者电影片段可以看出这段是 93 号公路的一个大拐弯。然后再放大地图到合
适的比例,就可以排查几个明显的拐弯处,很快就可以确定为 Gufufoss。
这里再引用社区虫友 @布拉格 的一个作答:
1、百度关键词:
白日梦想家 取景地
2、找到知乎问答链接:https://www.zhihu.com/question/54324735 ,翻找筛选 答主们提供的信息。里面提到了这个瀑布取景于冰岛 93 号公路 (埃伊尔斯塔济到塞济斯菲 厄泽)。
3、谷歌街景地图,找到并确认为 Gufufoss ,一路风光无限好~
在出题过程中我也有一个有趣的发现。有一对美国夫妇专门建立了一个网站介绍世界各地的
瀑布,他们对瀑布有着狂热的追逐。
https://www.world-of-waterfalls.com/
他和妻子以及后来生育的孩子的足迹遍布世界各地的瀑布~
强化意识 :你要寻找的答案就藏在你对它的描述里。你需要做的不过是从自己的描 述语句中分解出关键词组合,随即尝试进行搜索。
下面给出的关键词组合和结果是基于搜索引擎结果的首页,即前 10 条是否得到满意的结果 来评定的。
关键词 | 搜索引擎 | 结果 |
---|---|---|
苹果实时销量 每秒卖出多少台 网站 | 百度 | ✅ |
苹果实时销量 每秒卖出多少台 网站 | ❌ | |
apple every second site | ✅ |
今天我在超市买了两个长得有点儿奇特的水果 � 如下图所示。请问这是什么水果呢? ![虫子买的水果] (https://course.chongbuluo.com/.gitbook/assets/image%20%2823%29.png)
生活中类似问题很多,印象中有很多虫友对此的直觉反应是使用搜索引擎的逆向图像搜索功 能。但问题往往在于,这类图片有两个特征:
- 并非从网上下载,而是自己拍的;
- 图像的主体特征还不够特别明显(明显到可以与网上类似的图片有较高程度的匹配)。 比如上图,虽然这个水果的长相很具有辨识度,但随后经过逆向图像搜索的测试却没有得到 匹配的结果。说明因为拍摄角度、光线等原因,这张图的算法特征还不足以完成匹配。 其实,对于这类问题(符合以上两项特征),我还是推荐优先使用关键词来搜索。关键词的 运用看似稀疏平常,连乱七八糟的搜索指令也用不着,但我想在这一节的最后一个案例中强 调:在搜索中更合理地使用关键词是最重要的能力。重点来了 —— 使用关键词描述图片内容的三个维度:
- 属性描述:即问题指向的画面主体对象是属于什么品类,比如:水果、植物、网站. .....;
- 联想比喻:即你不知道它是啥,但你可以遍历你的大脑储备,说出它像什么;
- 特征描述:如果以上还不足以帮你找到答案,那么你可以进一步描述它的视觉特征; 以上三点,屡试不爽。各位可以在平时遇到此类问题时,有意识地按照这三个关键词生产要 素来进行尝试和经验总结。
我拍下这张照片准备作为案例讲解时,脑海中蹦出的关键词是:水果 像海参
,结果很理
想。
![Google 的搜索结果]
(https://course.chongbuluo.com/.gitbook/assets/image%20%2899%29.png)
![百度的搜索结果]
(https://course.chongbuluo.com/.gitbook/assets/image%20%2838%29.png)
我把这个问题提给女朋友时,她给出的关键词组合是:橙黄色 有尖刺 长得像毛毛虫的水果
,没有找到结果;第二次尝试:橙黄色 有尖刺 长得像虫的水果
,有结果,但无图片结
果,对于问题答案的确认就相对费时一丢丢。
这个火参果呀 ! 真难吃,买了两个 30 块钱。给我的感觉就是...... 籽儿特别大的黄瓜。各 位如果有没尝过的可以脑补下「籽儿特别大的" 」是什么滋味,作为购买参考。
下面这张照片中的树木顶端架着人行通道,看起来高耸入云,蔚为壮观!看到中间还站着几
个人,自己也好想体验一番。那...... 这是什么神仙树种呢?在哪儿可以体验到?
先别急着以图搜图!我们这一章节的主题是「关键词描述」,那么单纯使用关键词有没有可 能搜到图中的树木叫什么呢?试试! 首先,我们来尝试简述这张照片的最主要特征:树很高,树冠之间架设着人行过道。 接下来我们再尝试将特征描述提炼为关键词,并且列出可能会被用于描述这种特征的其它 词:
对象一 | 对象二 |
---|---|
树 | 人行过道 |
树冠 | 空中走廊 |
树尖 | 人行走廊 |
树顶部、树顶端 | 空中步道 |
最后,我们尝试将表格两列的词组合输入 Google 图片搜索,第一组结果显示: | |
![2019.6.15 测试结果] | |
(https://course.chongbuluo.com/.gitbook/assets/image%20%282%29.png) | |
这一组结果中第 1 张截屏效果最差;第 3、4 张次之(大部分指向了国外的几处类似景观) | |
;而第 2 张截屏中已经有了可以对应的结果(下拉会有更多与题目中的照片几乎一样的图 | |
片)。 | |
而经过测试,Google 图片搜索:树冠 空中走廊 这一组关键词的效果最佳! |
|
![2019.6.15 测试结果] | |
(https://course.chongbuluo.com/.gitbook/assets/image%20%28256%29.png) | |
最终得知,照片中的高大树木叫望天树,景点位于西双版纳热带雨林国家公园望天树景区。 | |
在西双版纳热带雨林上千种树木中,最高的树要数望天树。它最高的有 80 多米,一般都能 | |
长到 50~60 米。在我国以至整个亚洲现存的热带雨林植被中,望天树也可算是最高的雨林 | |
群落和最高的树种了。 |
本案例中展示了一种具有普适性的方法:用关键词描述图片的最主要特征,然后对特征关键 词制表(完全可以在脑海中完成),最后再排列组合输入搜索引擎尝试。 我们完全可以称之为「手工版的图像识别技术」 # 先用人眼提取图像特征,再为特征关键 词和同义衍生词建一个迷你的标签数据库 ——
对象一 | 对象二 | 对象三 | ...... |
---|---|---|---|
tag1 | tagⅠ | tagA | ...... |
tag2 | tagⅡ | tagB | ...... |
...... | ...... | ...... | ...... |
别忘了英文,即是在中文关键词搜索乏力时,尝试使用同义的英文词;另一方面由于英文网 站一般会根据 title 自动生成带语义的超链接,这也可能为搜索提供一些思路。
关注点 | 备注 |
---|---|
同义的英文词 | 可以获取更多中文关键词搜索未果的信息 |
英文网站的超链接 | 在某些场景下,结合高级搜索指令 inurl: 发挥作用 |
对于设计师或者美工来说,可能有时候单纯中文搜索相关的素材和灵感满足不了他们的需 求。那么换用英文同义词,便可以获取到全世界范围内相关的优质资源。
中文 | 英文 |
---|---|
扁平类插画 | Flat illustration |
涂鸦插画 | Doodle |
断点式错位填充插图 | MEB |
2.5D 轴测图 | 2.5D axonometric |
渐变类海报 | gradient poster |
品牌 logo | brand identity |
引导页 | onboarding |
动效 | animation |
落地页 | landing page |
再一一组合进行搜索(tag1 tagⅠ tagA 、tag2 tagⅡ tagA ...),以此来增加命中可能 |
|
存在目标图片或类似图片所在页面的文字的概率。 |
珠穆朗玛峰,8848 米(含雪盖)是顶级登山者们梦寐以求的高度。极致的高度意味着极致
的风光。
![从北面的青藏高原仰望珠穆朗玛峰]
(https://course.chongbuluo.com/.gitbook/assets/image%20%2862%29.png)
但同时,也伴随极度的不确定性。即便对于经验丰富的登山者而言,登顶珠峰也是一次生命
冒险。
请问:在攀登珠峰的历史数据统计中,一共有多少人在此丧生?其中有多少个中国人?
对于数据统计类信息的搜索,切勿盲信媒体尤其是各种自媒体的文章。要尽可能地寻找可靠 的信息源。 而这个案例重点想用来传递一个观点:对于非局限于中国范畴的数据统计类信息的搜索, 英文关键词往往比中文关键词能更快、更准的找到满意结果。当然,前提是使用 Google 、Bing 国际版等「更懂英文」的搜索引擎。 所谓中国范畴:是一个模糊的说辞,即根据你的认知判断,数据的统计、传播大体上时 发生于中国。举例来说,四川境内的湖泊数量(或其它水文数据)、重庆火锅店的数量、中 国西部近 30 年发生 6.0 级以上地震的次数...... 就属于中国范畴,即理论上用中文关键词即 可搜索到结果。(在这里 中国 = 中文)
使用珠峰
死亡人数
统计数据
等关键词任意组合,通过 Google、百度等搜索均未得到
满意的结果。
对比,使用 mount everest died
、how many died mount everest
等英文关键词,在
Google 和 Bing 国际版均可在维基百科英文版的词条中得到完整的统计列表信息。
截止到 2019.5.27,死亡人数为 308 人,其中有 12 名 $% 人。
维基百科的词条虽然还不足以谈权威性,但具体到某个词条,我们可以通过其引用信息来作
进一步的判断。
另外就是维基百科网站在 Google 和 Bing 的权重都很高,但由于其英文的词条数目远大于
中文,所以在中文搜索未果的情况下,有必要转换为英文来再次搜索确认。
这是在万物始于 Google! 一节中出现的一张截图,图中展示了分布于全球各地的 Google
数据中心。我现在告诉你:这张图是从 Google 官方的页面截取的,而非任何第三方转载的
网站。那么请找出这张图的出处页面。
一般我们是通过 Google 数据中心 分布图 地点
等关键词组合来尝试寻找答案。
而如果转而用英文关键词除了能够获取到更多结果,从另外一个角度看,还往往有助于更精
准得获取到目标网页。
这个角度即是英文互联网世界的超链接命名习惯:通常采用语义命名,即超链接中的目录名
和文件名描述了网页内容。
当然网址的命名也常来自于网页 title ,在搜索引擎的权重分配里:title > link ,而转换使
用英文关键词,则会更好地发挥两者的叠加效用,是结果更精准,你也就能更快地获知满意
的结果。
使用关键词:google data center location
或 google data center map
Google 搜
索:
可以看到,第一个结果即是精确的网页链接,而非需要通过其它页面跳转抵达。对比使用中
文关键词就可以看出其优势。
这仅仅是拿 Google 这种多国语言支持度很高的网站为例,如果换做其它英文网站来做对
比,那么很多场景下这种中英文的搜索精准度和效率的差距将更大。
所谓「神奇配方」就是用 你要找的对象 + 描述对象的特征词 来作为 Query 在 Google 、百度等通用搜索引擎中发起搜索请求。 垂直搜索引擎多数是通过定向爬取或者自建数据库来解决搜索精准度的问题,而神奇配方则 是用另外一种方式实现了更大规模内容抓取的精准化匹配。即虽然是通过 Google 等通用搜 索引擎来搜索,但由于搜索对象所在的页面往往有一些特征文本,所以组合这些特征词也可 以间接实现定向搜索。两种方式可谓貌离神合、殊途同归。
以搜索影视资源为例,大家会说直接在百度上输入电影的名字,回车就 OK 啦。这样搜索出 来的电影资源比较混乱,有的根本不能观看,有的是收费,有的可能就是陷阱或广告。 但如果组合一些在影视资源下载页面常见的「特征词」,效果就会大不一样。比如 ——
ed2k(eDonkey2000network)是一种文件共享网络,最初用于共享音乐、电影和软件电 影名+ed2k
可以精准搜索出这种文件资源。
eg:百度搜索:[复仇者联盟3 ed2k
](https://www.baidu.com/baidu?tn=baidu&word=%B8%B4%B3%F0%D5%DF
%C1%AA%C3%CB3+ed2k)
torrent 文件本质上是文本文件,包含 Tracker 信息和文件信息两部分。电影名 + torrent
也可以精准搜索出这种文件资源
eg:Google 搜索:[肖申克的救赎 torrent
](https://www.google.com/search?newwindow=1&hl=en&ei=a_sRXaH1IZCl
tQagrafwDw&q=%E8%82%96%E7%94%B3%E5%85%8B%E7%9A%84%E6%95%91
%E8%B5%8E+torrent&oq=%E8%82%96%E7%94%B3%E5%85%8B%E7%9A%84%E6
%95%91%E8%B5%8E+torrent&gs_l=psy-ab.3...257933.8295970..8296227...6.0..3.34
98.19430.1j4-3j10j7j9-2......0....1j2..gws-wiz.......0i71j35i305i39j0i10j35i304i39j0i13j33i
160j35i39j0i20i263j0.P0gDjbSGbXs)
1080p 是一种视频显示格式,电影名 + 1080p
可以精准搜索高清画质的电影,因为
1080p 是电影的画质属性,也就是搜索的结果会是电影资源,排除了其它干扰信息。当然
你也可以把 1080p 改为其它画质,比如 720p。
eg:必应国内版搜索:[Blue Planet II 1080p
](https://www.bing.com/search?q=Blue+Planet+II+1080p&qs=n&form=QBL
H&sp=-1&pq=blue+planet+ii+1080p&sc=0-20&sk=&cvid=7FFB7536DF0F4A40AC
BF915E8BA4F71E)
无论是影视资源下载,还是其它诸如:电子书、开放数据集。 承载这些内容的网页文本中 往往有一些特征词是你在搜索其它信息时根本不会碰到的,那么这些特征词其实就是在通用 搜索引擎中实现大规模定向搜索的「导火索」。同时也可以减少对众多服务不那么稳定的垂 直搜索的依赖,进而完成大脑的信息减负。
有些垃圾网站正是利用这一点来作弊骗流量。特别是很多 BT 站,如果你搜索的 Query 类
似这样:关键词 蓝光/HD/Blueray
,比如国庆大阅兵精选集蓝光,如果这都能搜索到结
果,那么这个网站基本就不用再访问了 —— 大都是诱骗访客点击疯狂跳转广告的网站。
强化能力:「无中生有」场景下的关键词运用。
操作要求:请单纯使用关键词搜索这一种方式,找到以下图片(不要求尺寸一致)
。
练习建议:请在快速浏览一遍我提供的图片素材后离开此页面再搜索,这样更逼近真实
场景。
请按照下面表格的提示来尝试搜索在你脑海中已经变得模糊的事物。 | 搜索对象 | 模糊点 | 搜索要求 | | ------------------------------ | ------------------ | --------------------------------------------------------- | | 你在某网站看到的一篇文章 | 忘记标题 | 在 Google 、百度中搜索 | | 你在微信公众号看到的一篇文章 | 忘记标题 | 在[搜狗微信] (https://search.chongbuluo.com/#wechat)中搜索 | | 在虫部落看到的一个效率工具 | 忘记软件名 | 在[虫部落] (https://www.chongbuluo.com/)站内搜索 | | 在本教程中出现的第一张配图 | 还有印象吗 | 在 Google 、百度中搜索 | | 此时此刻你脑海中闪现的模糊事物 | 只有你「最清楚」 & | 无所不用其极地将其搜出 |
Query | 搜索引擎 | 结果 |
---|---|---|
长颈鹿 骑着 长颈鹿 |
百度 | ✅ |
长颈鹿 骑 长颈鹿 |
Google、百度 | ❌ |
Query | 搜索引擎 | 结果 |
---|---|---|
一棵树 N多熊猫 >> Google 反向图像搜索 |
Google、Google images | ✅ |
|
| N多熊猫在一棵树
(百度联想:27 只熊猫趴在一棵树上) | 百度 | ✅ |
Query | 搜索引擎 | 结果 |
---|---|---|
锤子 Windows 进化 |
Google 图片搜索 | ✅ |
锤子 Windows 进化 |
必应图片搜索 | ✅ |
锤子 Windows 进化 |
百度图片搜索 | ❌ |
Query | 搜索引擎 | 结果 |
---|---|---|
微软收购GitHub 鬼 |
百度 | ❌ |
微软收购GitHub 鬼 |
✅ | |
微软收购GitHub 命运 |
百度 | ✅ |
微软收购GitHub 命运 |
❌ |
由关键词发起的图片搜索基本可以满足日常的找图需求,但是如果想更精准地找到合适的图 片,则需要按照图片本身的属性来进行过滤筛选。 好在 Google、百度、必应等通用搜索引擎的图片搜索都自带帮助用户筛选的工具,下面就 看看它们的共性和各自的特色。这里面绝对有你不知道或者平时压根儿没注意多的选项。注 意高亮部分为各自的特色!
- 大小:大 | 中 | 图标 | 大于... | 指定尺寸
- 颜色:彩色 | 黑白 | 透明 | 红 | 橙 | 黄 | 绿 | 青 | 蓝 | 紫 | 粉 | 棕 | 黑 | 灰 | 白
- 类型:脸部特写 | 照片 | 剪贴画 | 素描画 | 动画
- 时间:过去 24 小时 | 过去一周 | 自定日期范围
- 使用权限:可再利用和修改 | 可再利用 | 可再利用和修改,但不可用商业用途 | 可再
利用,但不可作商业用途
- 尺寸:特大 | 大 | 中 | 小 | 电脑壁纸 | 手机壁纸 | 自定义
- 颜色:红 | 橙 | 黄 | 绿 | 青 | 蓝 | 紫 | 粉 | 棕 | 黑 | 灰 | 白 | 黑白
- 类型:头像图片 | 面部特写 | 卡通画 | 简笔画 | 动态图片 | 静态图片
- 图片尺寸:小 | 中 | 大 | 特大 | 自定义
- 彩色:彩色 | 黑白 | 红 | 橙 | 黄 | 绿 | 青 | 蓝 | 紫 | 粉 | 棕 | 黑 | 灰 | 白
- 类型:照片 | 插图 | 素描 | 动画 GIF | 透明
- 版式:方形 | 横板 | 竖版
- 人物:脸部特写 | 半身像
- 日期:过去 24 小时 | 过去一周 | 过去一个月 | 去年
- 授权:所有创作公用 | 公共领域 | 免费分享和使用 | 在商业上免费分享和使用 | 免费分
享、修改和使用 | 在商业上免费分享、修改和使用
以上是列举对比,从中可以看出,就筛选项的完备程度:必应 > Google > 百度 ,但是并 不好说谁最终的效果就更好,因为这还要取决于其索引图片的质量等等因素。 你大可不必记住这些筛选项,但最好熟知,或者最起码你得知道有这么些可以让你精准找 图的辅助工具! 因为相较于不断地累加关键词来缩小你找图的范围,这些工具更加有效和方便,当然精确度 也更高,图片被辅助关键词误杀的概率也越小。
首先虫子很幸运和我的一位也是唯一一位笔友的微信瞎聊中捕捉到写下本篇主题帖的灵感,
开心~
什么灵感呢?是关于搜索中比较常见的歧义类关键词的处理技巧和方法。这次我不准备一下
子全部展开,先抛砖引玉,各位虫友动手动脑,再自己尝试总结... 最后我们来一个解决此类
问题的最佳实现策略汇总。
笔友在德国读书,她问虫子的问题... 我是简单粗暴的试着搜了下 「德国 樱花 城市」 这三
个关键词的组合,结果呈现中很容易看出有多项提到汉堡这座城市(当然还未经她回复验
证,也许是其它...anyway... 这不是我们讨论的重点了)。
接下来,既然汉堡樱花看起来也很出名,那 —— 搜罗下照片摄影瞅瞅?来吧~
咦???虽然这粉粉的汉堡确实是勾起了虫子的少女心(脸呢 ==!),可... 这不是我想看
到的结果:o
换英文试试?来吧~
![Google 图片搜索【sakura in Hamburg】]
(https://course.chongbuluo.com/.gitbook/assets/image%20%28232%29.png)
呃... 相比上一次的惨不忍睹,这个... 还次总算开始沾边了。当然那个介词 in 也起了一点小
小小的作用。
这就作罢吗?No! 是时候请上图片搜索辅助工具了。
![关键词同上,query 增加过滤项【Large + pink + Usage rights + Photo】]
(https://course.chongbuluo.com/.gitbook/assets/image%20%28131%29.png)
是不是画风瞬间突变!?我在这里加了三个图片过滤条件:尺寸中选 Large,颜色中选
pink,类型中选 Photo (其实只选择 pink 效果已经满足了)。
到这里急刹车来简单回溯下:问题的关键在于「汉堡」这个关键词是有歧义的。它最广泛被
理解语义是「一种快餐」和「一座城市」。
之前在一家公司做的项目对此类具有歧义的关键词进行预处理的最简单粗暴的方式即是:
汉堡 —>「一种快餐」—> 汉堡 快餐;
汉堡 —>「一座城市」—> 汉堡 市。
注:这里的辅助词「快餐」和「市」只是主观的臆测,实际更合理的操作应当通过算法对
要定向抓取的文章进行自然语言处理,建立一个一对多的歧义搭配语料库。
这种方式的优缺点都很明显。优点是对定向的主题内容来说基本实现了「算法的高度复
用」;缺点则是在进行语义分析时,对大量主题中无论是作为快餐还是城市的「汉堡」的周
围所覆盖的高频词的百分比设定很难把握。所以这也只是一种看起来比较人工智能的手段。
再回到「汉堡 樱花」,在不考虑方法的普适性的前提下,各位虫友都还有哪些操作来实现
「找到数量多质量高的在德国汉堡这座城市拍摄的樱花照」这一目的?
这当然得你亲自动脑动手去尝试,而不是想当然。
最后,我一直觉得最好的提升搜商的途径一定是要亲自动手尝试,而不是习惯了填鸭式的眨
眨眼睛、耸耸耳朵听谁口若悬河一通就搞定了的 —— 这是不是有点像武侠小说中,得到一
本武功秘籍翻看一遍甚至背得滚瓜烂熟就称霸武林了?当然不是,一招一式,也得百炼方能
成精 '
想找一些身穿紫色(2018 赛季客场球衣的颜色)球衣的皇马球员的照片,嗯,只因怀念那 个骚气冲天的皇家马德里!有什么好的方法? 针对非球迷群体的补充: 皇家马德里是一家位于西班牙首都马德里的足球俱乐部,成立于 1902 年 3 月 6 日,是世界足坛最成功的足球俱乐部之一。主场是可以容纳 81044 人的伯 纳乌球场。
在使用通用搜索引擎的图片搜索时,注意培养自己使用辅助工具的意识。 对于视觉类的图片搜索问题,建议优先使用图片搜索引擎的辅助工具来进行筛选。一般来 说,这样得出的结果,其数量和质量都要优于要比单纯使用关键词。
反向图片搜索本质上是利用图像识别技术,来对已编入索引的图片进行相似度比较和匹配的
过程。
TinEye 是第一个使用图像识别技术的基于网络的图像搜索引擎。最初是以版权所有者和品
牌营销人员为目标用户群创建的,用于查找未经授权的使用情况并分别跟踪品牌所在的位
置。
备注 | |
---|---|
Images](https://course.chongbuluo.com/images-search/reverse-images-search/%2 | |
0https:/www.google.com/imghp) | 识图界的最强王者。 |
百度识图 | 改版后貌似算力下降了。 |
| | TinEye | 以图搜图界的老字号。 | | Yandex | 战斗民族的产品,没啥亮点。 | | 淘宝拍立淘 | 识别商品有一套,毕竟数据 多。 |
- 对某图片感兴趣,想知道它的来源或内容创建者
- 不满于小图、水印图,想找更大更清晰的图
- 只有图片的局部,想找到该图的完整版
- 心仪模特的穿搭照片,想买同款
- 摄影师、设计师等图像创作者想知道哪些网站使用或盗用了他的作品
所谓不拘一格,即是不局限于使用 Web 引擎。微博提问并 @博物杂志,加入相关社群咨 询,摆脱程式化的刻板思维,灵活使用网络和现实世界的「活着的搜索引擎」。 ![评论区很容易得知这种鸟是珠颈斑鸠] (https://course.chongbuluo.com/.gitbook/assets/image%20%28127%29.png)
下面这张图片是虫友
@Marcus 的头
像( [头像链接]
(https://www.chongbuluo.com/uc_server/avatar.php?uid=5814&size=small))。
请使用反向图片搜索找到它的大图(或叫高清图)。
使用 Google 反向搜图,在「包含匹配图片的页面」的搜索结果中,图片最大尺寸为此条:
如果你就此止步,那么你将得到的是这张图 ——
但是,如果利用这张相对画面更完整也更清晰的图片继续反向图片搜索呢?看!
6008 x 3384 耶✌点进 B 站这个页面(是什么让我三个月减掉了 70 斤?
),发现图片不能直接右键保存,一般遇到
这种情况借助控制台都可以解决。F12 或者右键「审查元素 / Inspect」即可打开控制台:
![图片被设置为区块的背景]
(https://course.chongbuluo.com/.gitbook/assets/image%20%28103%29.png)
图片链接: <https://i0.hdslb.com/bfs/article/c3f3bb346799ef4e5c673177ae715426e850626a.jp g@1720w_963h.webp> 从链接可以看出这张图片是以目前流行的 Google WebP 格式作为默认加载的,不过链接 里保留了 JPG 格式的明文跳转,去掉末尾的 @1720w_963h.webp 即可。
类似的情况有很多,一次搜索得到的可能并非最佳结果。一般如果 Query 的图和第一次搜 索得到的图在图像内容的完整度上有差异,那么别止步!继续利用后者进行二次反向图片搜 索,往往会有更满足你需求的发现。
1、阿基米德、牛顿、高斯被并称为世界三大数学家,而对于我来说认识他们都是从一个个
有趣的故事开始。
「给我一个支点,我就开始撬动地球」,在泡澡时想出了辨别皇冠真假的方法。兴奋地从浴
盆跳了出来,裸著身体就跑了出去,边跑还边喊著 "εύρηκα!(我发现了!)" 这就是阿基
米德,以及由此诞生的一个力学公式 ——
$$ F 浮 = G 排 =ρ 液 gV
$$
剑桥大学为了预防伦敦大瘟疫而关闭,此后两年一直待在家中而突然有一天坐在后院的苹果
树下被落下的苹果砸中。这便是牛顿与苹果的传说,以及由此诞生的万有引力定律 ——
$$ F=(GMm)/r²
$$
数学教师布特纳布置了一道数学题,1+2+3・・・・・・这样从 1 一直加到 100 等于多
少。很快就有一个孩子坚定地报上了答案:5050!这即是数学天才高斯,以及由此得出的
高斯求和公式 ——
$$ 和 =(首项 + 末项)x 项数 /2
$$
相较于他们在数学领域建筑的众多丰碑,以上只是为人们津津乐道的花边故事,所以后人以
各种方式来表达对他们的纪念。
◆ 编号为 A、B、C 的小行星分别以阿基米德、牛顿、高斯(以下简称阿牛高)的名字命
名;
◆ 美国、英国和德国分别发行过 D、E、F 面值的纸币(不考虑单位)分别用以纪念阿牛
高;
其中美国发行的这一版局部票样如下图:
◆ 意大利 1983 年、德国 1993 年、澳大利亚 1974 年分别发行过 G、H、I 面值的邮票(
不考虑单位)分别用以纪念阿牛高;
所以本期题目的问题即是:A+B+C+D+E+F+G+H+I=?
行星编号和邮票编号都很容易找到,只是因为选择路径的不同,效率会有所差异。问题重点 在于这张被我故意裁剪的图片的逆向搜索。只有找到完全的原图,才能看到票样中的面额。 当然熟悉 eBay 等电商平台(有拍卖交易且有自己的图像分析鉴别系统)的虫友,也可以直 接通过关键词来直接在结果中找到这张图的原图。不过这都不是设计初衷想传达的另外一种 在图片逆向搜索中具有普适性的方法 —— 优化搜索引擎判定出的关键词。
首先按照常规的,只是将图片甩给图片搜索引擎的话,无论是 Google、百度、Tineye 等
等都无法识别到面值未被遮挡的原图或微改的图。这是经过大量测试排除意外所得的结论。
而随着题目发布一段时间后,可以看到那个帖子成为了搜索结果 —— 但是对于答题毫无意
义 —— 面值依旧未知。
具体到这张纸币而言,即是将票面所印刷的文字输入图片搜索框 ——
现在再来看「外观类似的图片」是不是感觉画风突变?点进去查看全部类似的,很容易就能
找到解题所需的那张纸币,甚至还有多种样式。
小结:在图片逆向搜索结果不理想的情况下,将你所掌握的有关图片的更多细节信息输
入图片搜索框,往往会有助于你在「外观类似的图片」中找到原图或微改图。
来自虫友
@ZHOUZHOU
在 虫部落社区的提问:搜遍了淘宝和阿
里,都找不到这款产品,不知道是不是姿势不对,求助虫友。
这个直接用利用 Google 或者其它反向图片搜索都无果。不过,将上图拆分为单独的 7 张
图再去反向搜索也许会有结果或者线索。我是单纯觉得太麻烦就没去试。不过这的确是一个
有效的思路 —— 图片显然是拼接的,图像主体太多,表现的特征也多,搜索引擎进行图像
识别匹配的难度会增大。所以遇到这种情况是可以试试「弱水三千,只取一瓢饮」。
但是,我相信
@ZHOUZHOU
也注意到图片左上角的文字了,可能是她视力不如我吧 我隐隐约约还是用肉眼辨识出写
的是:ALINE STUDIO SUNDIAL(第一个单词最后一个字母不确定是 E 还是 G,反正都试
下吧)。
Google 图片搜索 aline studio sundial:
看到有匹配正确的结果,多点几个结果,就可以找到这款产品的详细(包括购买)信息。
呃... 总结起来有点小儿科,但图片上的文字的确是重要的线索。即便它可能一眼看过去 是模糊不清的 —— 但!试着挤挤眼或者借助一些图片无损放大工具呢? 图片无损放大在线工具: 人工智能图片放大 ; waifu2x。
之所以把「如何搜索锁定照片中的坐标位置、拍摄地点」来作为一个专题,是因为这里面可 供培养我们对于信息线索的敏锐发掘意识的素材有很多。 所以不同于发动网民集体力量的「人肉搜索」,这里强调和推崇的是通过独立的发现和梳理 来获取照片的位置信息。我们的宗旨是:绿色环保,与人无害
在本篇的子节点,我会列举一些案例来和各位共同探讨锁定照片拍摄地点之道。这里先总结 几点规律性的经验。
- 照片中的文字信息
- 照片的 Exif 信息(有些照片会在照片后续加工中涂抹掉此信息)
- 照片来源网站的相关描述
下图是我早年前在浏览某论坛时看到的一位网友的头像,当时就近乎下意识地保存了(可能
源自一个球迷的自我修养 �
请问:这张照片拍摄于哪里?时间?
这么小尺寸的头像是看不出什么端倪的,当然也不存在有用的 Exif 信息。所以首先需要进 行反向图像搜索,尽可能找到原图!再循规蹈矩,按照父节点提出的 3 个要点来进行进一 步搜索。
首先,通过 Google 反向图像搜索,找到头像缩略图的高清大图(所在网页的链接:
Supercopa
Showdown
)。

上图是在进入 Supercopa
Showdown
,然后再点击目标图片两次(两次跳转)后,得到的最终图片(尺寸:1280X949)。 网页
显示文章的发表时间为: AUGUST 29, 2012 ≠ 照片拍摄的时间。
接下来,观察照片中的文字信息。
包含三个店名(按由近及远的顺序):
- HPB 以及其 LOGO;
- MEPHISTO 以及其 LOGO;
- PECAT;
Google 搜索 HPB,在搜索结果中依据 LOGO(虽然存在 LOGO 换新的可能)和开在街边
的可能性最终确定是一家克罗地亚的银行,全拼为 Hrvatska poštanska banka;
百度搜索 MEPHISTO 可知其中文名:马飞仕图,是世界三大休闲品牌名鞋之一;
百度或者 Google 搜索 PECAT 暂时认为它是 The Physical Education Curriculum Analysis Tool 的简称,直译大概是一种体育课程分析工具,有可能是卖运动领域电子设备 的吧。 既然有克罗地亚的一家看着还挺小的银行,那么不妨先把地图搜索的范围放在克罗地亚这个 国家吧。于是,Google 地图搜索这家银行,结果地图上粗现了十几个红色的 ATM 标记, 而且大部分都被街景拍到了,接下来一个个点进去「实地查看」么?也行啊,顺便欣赏下异 国他乡的风土人情 ) 不过,如果你再试着在克罗地亚范围内搜索这个鞋店(关键词:
Hrvatska MEPHISTO
),卧槽!!!地图上显示只有一个!而且被 Google 的街景车拍到了!赶紧切换到街景模 式点进去瞅瞅!([Google 地图坐标 ](https://www.google.com/maps/@45.8122646,15.9775727,3a,75y,162.72h,80.84t/ data=!3m6!1e1!3m4!1sv0bVh8Xv2otqeSA-KQ17YQ!2e0!7i13312!8i6656!6m1!1e1) )由此确定了这张照片的具体拍摄位置是克罗地亚首都萨格勒布市的 Praška ul. 街区。 最后,再试着查看下照片的 Exif 信息。
这个修改日期基本可以确定为照片的拍摄时间(排除蛋疼的人为修改)。具体论证,可通过 人物穿着对照气象记录中那一天的天气,以及将街景镜头在此处方圆几百米推一推,看看哪 里有显示当地的时间。
在反向图片识别领域除了 Google 图片搜索这样的「不挑食」的以外,还有一些细分类型的 应用。比如人脸、植物、花卉以及动漫等等。 正所谓术业有专攻,这些图像识别引擎一定是有自己针对性的算法,以满足特殊场景和事物 的识别需求。
| 名称 | 功能 | | ----------------------------------------- | ------------------------------------------------------------ | | PimEyes | 人脸反向搜索,基于人物脸部的搜索引擎, 认别率相当高。 | | 看图识花 | 花卉植物反向搜索,测试综合识别率不如 Google lens。 | | 小程序 | 微信搜索小程序:形色识花、识花君、拍照识花君,植物 类识别精准度很不错。 | | EveryPixel | 素材反向搜索,集合了 50 个图库图,入门 级别的设计狗的最爱。 | | 链图云 | 素材反向搜索,国内的一款方便设计师们快捷 找图的工具。 | | WAIT | 动漫反向搜索,搜索超过 22300 小时的动漫并找 到最佳匹配场景。 | | Ascii2d | 动漫反向搜索,支持 5MB 以内的 JPEG、PNG 格 式的图像上传。 | | IQDB | 动漫反向搜索,支持同时搜索多平台站点的动漫、 漫画以及游戏壁纸。 | | 3D IQDB | 三次元动漫反向搜索。 |
trace.moe 是一个以图搜番的搜索引擎,可帮助你通过屏幕截图追溯原始动漫。它搜索超过 22300 小时的动漫并找到最佳匹配场景。它能告诉你截图出自哪部动画、哪个剧集以及场 景出现的时间!由于搜索结果可能不准确,因此它提供了几秒的预览验证。 有很多动漫截图和 GIF 在互联网上传播,但很少有人提供消息来源。虽然这些在线平台越来 越受欢迎,但 trace.moe 通过向感兴趣的动漫迷展示原始资源来表达对原始制作人和员工 的尊重。 trace.moe 是非营利性的。也没有所谓的专业或高级功能。当然它也不适合观看动漫,所以 你会看到它禁止用户访问超出预览限制的原始视频。自从 2000 年以来的大多数动漫都被编 入索引,但有些被排除在外。 trace.moe 仅分析官方发布的动漫。如果您想搜索艺术品或壁纸,请尝试使用 SauceNAO 和 iqdb.org。 除了网页版,trace.moe 还提供了更为方便的浏览器扩展: [Chrome](https://chrome.google.com/webstore/detail/search-anime-by-screensho/ gkamnldpllcbiidlfacaccdoadedncfp)、 [Firefox](https://addons.mozilla.org/en-US/firefox/addon/search-anime-by-screens hot/)、 [Opera](https://addons.opera.com/en/extensions/details/search-anime-by-screens hot/)。 ![搜番结果截图] (https://course.chongbuluo.com/.gitbook/assets/image%20%2856%29.png)
百度搜图搜到贴吧里的同样的问题,下面有人答是深圳地王大厦、有的说是鸿隆世纪广场, 去地图上一看其实很近,根据图片和街景对比估计是深圳供电南苑的楼顶。(虫友 @我爱牙 叔 的解答过程)  
重庆轨道交通一号线大学城站站台上面朝西照的。  图 2 近处广告牌只能看见重庆市沙坪坝区大学城几个字,远处的两栋楼一个是 xx 街一个是 xx 公寓,此外注意到的点就是这里是一个十字路口,一条路上有地铁(实际是在高架上 面),路口旁边是一片绿地,绿地远处有一栋类似教学楼的建筑,也可能是党政机关。其实 从沙坪坝区大学城就应该直接搜一下的,当时认为广告投放的地址和广告所说的活动地址可 能不是一个,就错过了正确答案绕了一大圈。  根据地铁这个信息,在地图上找沙坪坝区地铁线附近的十字路口,此处又进入了一个误区, 盲目自信的去判断楼房的朝向(通常是坐北朝南),所以误认为这段地铁线是南北走向的, 重点观察南北走向地铁线附近的十字路口没找到,重新从头开始看,才在大学城站找到符合 条件的街景。   这么一个答案绕了好多弯路,可以做反面教材了。
扫下支付宝或加手机号 “13547082885” 显示「周记肉夹馍」,头像如下:  手机号 “13547082885” 显示为四川德阳 百度「西安 周记老字号老香炉腊汁肉夹馍」显 示一家,但网页已经无法显示,点击[网页快照] (https://www.nuomi.com/deal/l00syrnz8.html)。  确定此家曾经有外卖。手机美团定位到四川,搜索「周记老腊汁肉夹馍」显示一家(老香炉 打错成老乡炉了!!), 确认地址即:四川省广汉市南昌路四段(中国民用航空飞行学院 旁)
日本京东的秋叶原,中央大道。双马尾、丸子头... 都是发源于此。
四川省成都市高新区天华路 509 号(目前该店已倒闭)。
除了在线网络搜索,我们平时还会有很多本地搜索的需求,特别是在要处理大量繁杂工作的 生产力平台。所以本章节将为各位分别介绍 Windows、macOS、Linux 平台的最佳桌面搜 索解决方案。
话说写这部分内容时开始怀念起当年折腾 Linux 和 Windows 的闲得蛋疼的时光。现在基 本只用 MacBook Pro 干活儿。有很多在 Windows 上贼好用的软件,比如 [FScapture 绿 色版:轻量级的截图、录像、取色、标尺工具] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=29),再比如这节 必须提名的 Everything。 很多软件是跨平台的,并且体验差异不大。但有些软件,受制于系统底层而无法做到跨平台 兼容、可用。Everything 的极速索引即是建立在 Windows 对于 NTFS 的支持。所以,至 今还没有出现在任何平台比 Everything 更快的本地搜索软件。如果有,求打醒。 而说到 macOS 呢,我个人觉得就速度而言 Easyfind、Spotlight 和 Alfred 都差不多...... 差不多够给 Everything 提鞋。 Unix/Linux 下,如果你熟悉 shell 那就没的说了。对于新手,如果有封装好的 locate 想必 是极好的。我自己也更是没用过带 GUI 的,所以这里仅给出可供选用的参考。
拨云见日,这里大概总结梳理了目前各个平台好的桌面搜索方案。
操作系统 | 软件 / 命令 |
---|---|
Windows | Everything、Listary 、FileLocator Pro |
macOS | Easyfind、Spotlight 和 Alfred |
Linux | locate、find |
Ctrl/⌘ + F 可以说分别是 Windows 和 macOS 上的系统级搜索操作。从资源管理器到浏览 器,从 QQ 到 Excel,从编辑器到邮件...... 它可以随时调用出搜索框。 它很简单,简单到无人不知,简单到很容易被忽视掉。所以请问目前你正在浏览的这个页面 中有多少个「的」字呢?
可能是 Windows 平台最好的免索引全文搜索客户端。
不同于 Everything 和 Listary 这类文件名快速索引工具, Filelocator Pro 不仅能搜索文件
名,更擅长对指定文件和目录进行全文搜索,并且支持多种搜索表达式以及日期属性等个性
设定,快速准确定位你所需要的文档,极大提升了搜索效率。
官方有免费版和专业版完整的 Feature Comparison。 这里摘选两个实用频率较高的特性。 \1. 支持 50+ 常用文档格式的全文搜索 FileLocator Pro 原生支持常见的 30+ 种 Office 文档以及 PDF 格式下的快速全文搜索,操 作简单。通过安装 Microsoft Office 2010 Filter Pack 筛选器, FileLocator Pro 即能更好的支持全文搜索 Office 文档,额外支持 20+ 种格式,包括 .docx, .docm, .pptx, .pptm, .xlsx, .xlsm, .xlsb, .zip, .one, .vdx,.vsd, .vss, .vst, .vdx, .vsx, .vtx 等。 2. 支持对压缩包内文件进行深度搜索 支持 ZIP,JAR,7Z,RAR,TAR 等格式的压缩包,可以使用拖放或复制 / 粘贴从存档中提 取找到的文件。
\1. 官方网站($59.95,提倡支持正版) \2. 绿色免安装无限次激活版安装步骤:
- 首先安装 Microsoft Office 2010 Filter Packs。
- 下载绿色免安装版 FileLocator 8.1.2722(包含 32/64 bit)( 提取码:dcxr),解压后运行 reset_filelocator.bat,FileLocatorPortable 默认有 30 天的 试用期,在试用期结束后,运行 reset_filelocator.bat 可以再次获得 30 天有效期。
Everything 是 Windows 上一款搜索引擎,它能够基于文件名快速定文件和文件夹位 置。不同于 Windows 内置搜索,Everything 默认显示电脑上每个文件和文件夹。你在搜 索框输入的关键词将会筛选显示的文件和文件夹,当然它还可以通过搜索函数 content: 来 搜索文件内容。 Everything 是一款免费软件。软件开发维护不易,请酌情考虑[捐赠] (https://www.voidtools.com/zh-cn/donate)。 ![Everything 界面] (https://course.chongbuluo.com/.gitbook/assets/image%20%2824%29.png)
各位有感受过被 Windows 内置搜索支配的焦虑吗?Everything 如同一个猛男,带给用户 最强烈的「快感」,这是他的安身立命之本。 Everything 仅索引文件和文件夹名,一般仅需几秒便可建立其数据库。全新安装的 Windows 10 (大约 120,000 个文件) 仅需 1 秒即可索引完成!
Everything 积极响应节能减排的环保号召,占用系统资源极少。全新安装的 Windows 10 仅需要大约 14 MB 的内存以及不到 9 MB 的硬盘空间。
Everything 也是一款可以傻瓜式上手的软件,我们平时的高频搜索需求,无需任何指导即 可自如使用。当然,如果你还想深度挖掘它的潜力,比如高级搜索,可以参阅官方的支持 文档。
官方下载页面 下载 Everything 1.4.1.935 下载安装版 32bit | 下载安装版 64 位 | 下载便携版 32bit | 下载便 携版 64 位
据说 Listary 的一开始的功能核心是对话框增强。但是很多用户偏偏也将其作为一个搜索工 具来用,导致开发者也有些尴尬,索性一不做二不休,就朝着用户喜闻乐见的方向也不断优 化。 所以,官方现在是这么自我介绍的:
Listary 是一款革命性的 Windows 搜索实用程序,可以为普通和高级用户提供快速查找 文件和启动应用程序的功能! ![Listary 界面] (https://course.chongbuluo.com/.gitbook/assets/image%20%28185%29.png)
就 Feature 来说,Listary 是比 Everything 要多很多,但由于本教程的主题是搜索,所以 这里只摘选其个性化的搜索功能来展示。
作为 Listary 最强大的搜索功能之一,只需从 Windows 环境中的任何位置开始输入所需文
件或文件夹的名称。“键入查找” 功能会立即打开一个列表浏览器窗口,其中包含匹配的
文件,文件夹或应用程序列表。
通过磁盘搜索,您可以快速查找系统中每个驱动器上的文件和文件夹。只需打开一个资源管
理器窗口或开始在现有窗口中输入,而不是 Window 默认需要一次选择一个驱动器,而磁
盘搜索将在连接到系统的任何驱动器上快速找到您正在寻找的内容速度。
使用强大的 Listary Keyword 引擎,您可以直接在 Listary 的命令窗口中键入搜索,以启动
任何网站或搜索引擎的浏览器窗口。
您只需单击两次 Ctrl 键启动 Listary 并开始键入关键字搜索,而不是单击或跳转到浏览器。
例如,「gg 虫部落」将在您喜欢的浏览器中打开「虫部落」的 Google 搜索结果。
Listary 包括针对热门网站的大量关键字查询,如 Twitter,Facebook,维基百科,
Youtube,Bing,亚马逊,Google 地图等等。
对于 Pro 版用户,Listary 集成了广受欢迎的工具,如 Total Commander,Directory
Opus,XYplorer,Xplorer2,WinRAR,FileZilla 等等(我只用过最后两个工具......)!
当然说回到和本教程主题相关的搜索功能提升,也是有的 —— 高级语法搜索(不过
Everything 是免费持有 � )。
假设您在 D 盘上有一个名为 Deadpool.jpg 的图像,名为 ComicCon2015。使用 Pro 版
的高级搜索,你可以使用 “deadpool” 开始搜索。如果你没有得到你想要的结果,或者
返回太多,只需添加 “comiccon” 即可快速缩小范围!如下图所示:
官方提供了免费版和高级版的完整功能对比,供各位作为购买的决策参考吧。
| 功能 | Free 版 | Pro 版
|
| ----------------------------------------- |
------------------------------------------------------------ |
------------------------------------------------------------ |
| 磁盘搜索 | |
|
| 立即搜索所有驱动器中的文件和文件夹 |
|
|
| 高级搜索语法:匹配父文件夹路径 |
|
|
| 高级搜索语法:搜索过滤器 |
|
|
| 索引和搜索共享网络文件夹 |
|
|
| 索引和搜索自定义位置 |
|
|
| 设置文件夹的关键字 |
|
|
| 启动应用 | |
|
| 搜索并启动已安装的应用 |
|
|
| 搜索并启动 Windows 应用商店应用 |
|
|
| 打开搜索引擎和网站 |
|
|
| 为应用设置自定义关键字 |
|
|
| 操作 | |
|
| 基本行动 |
|
|
| 高级操作 |
|
|
| 创建自定义操作 |
|
|
| 设置热键以执行操作 |
|
|
| 设置操作的关键字 |
|
|
| 积分 | |
|
| 查找 - 作为你型 |
|
|
| Windows 资源管理器 |
|
|
| 打开 / 保存文件对话框 |
|
|
| 第三方文件管理器 |
|
|
| 主题 | |
|
| 使用主题 |
|
|
| 创建自定义主题 |
|
|
| 快速切换 | |
|
| 使用热键在文件管理器中打开活动文件夹 |
|
|
| 自动切换到活动文件夹 |
|
|
| 列出所有当前打开的文件夹 |
|
|
| 最喜欢和历史 | |
|
| 添加收藏夹文件和文件夹 |
|
|
| 使用子菜单整理收藏夹 |
|
|
| 最近的文件和文件夹 |
|
|
| 发送至菜单 | |
|
| 使用 Windows 发送到菜单 |
|
|
| 发送到任何文件夹 |
|
|
| 用热键触发 |
|
|
| 打开菜单 | |
|
| 使用 Windows 打开菜单 |
|
|
| 用热键触发 |
|
|
| 命令 | |
|
| 内置命令 |
|
|
| 自定义命令 |
|
|
| 项目 | |
|
| 搜索项目 |
|
|
| 使用关键字命令将当前文件夹添加到 Projects |
|
|
| 选项 | |
|
| 高级选项 |
|
|
| 批量添加文件夹 / 网站 / 自定义命令 |
|
|
| 许可选项 | |
|
| 使用限制 | 仅供个人使用 | 没有限
制 |
| 许可期限 | | 一生
|
| 许可证价格 | 自由 | 19.95 美
元 |
官方下载页面 | [Listary – 文件浏览增强工具] (https://chongbuluo.com/thread-673-1-1.html)(内附免费注册 Pro 版方法)
在过去很长一段时间,我遇到形形色色的人来咨询一些问题。比如,某个职业为猎头的妹
子,她问我有什么好的搜寻高端人才(企业高管,职业经理等等)的途径?我是一脸懵逼
的。
诸如此类细分行业领域的信息搜集问题很多,但显然我不能打肿脸充胖子在自己陌生的知识
盲区里给别人说一到二。每个人都有自己的知识疆界,对于越界的问题我选择闭嘴,就当是
对知识留存一点敬畏吧。
所谓「术业有专攻」,我想既然职场新人在自己领域有这么多搜索上的困扰,那么作为一个
力图不断完善来构建完整搜索体系的教程,它应当可以做得更好。而这是一个漫长的需要付
出专门时间和心力的过程。
所以我会在下一版的更新中,针对这部分内容去至少腾出 2 个月时间(不上班、不恋
爱、不吃饭...)去找寻有诸多特定搜索需求的各个细分领域的老司机,以类似记者的身
份来采访并记录。
我不知道最终会有多少内容呈现,也许很庞大,也许很微缩。总之,希望这部分内容给有特
殊需求的你带去帮助。
我做了两个表,一个是按职业人群划分,一个是按知识领域划分。最终,再对交叉的内容做 排重和映射,似得各位按照其中任何一个分类的查询都可以获取到完整的相关内容。
如果说 Google、百度等传统搜索引擎是 Office 基础办公套件,那么本章节里所介绍的各 类专业搜索引擎就像「插件」。插件会针对人们的一些操作进行有针对性的优化,让你能更 快、更准确地触达目标。而这些活儿如果换做 Google 来做,大多数情况下也可以殊途同 归,只是效率上可能不及专业搜索引擎。 正如虫友 @[辜鸿北] (https://www.chongbuluo.com/home.php?mod=space&uid=6218) 在[很强大的 Excel 插件:方方格子注册破解] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=6287) 的跟帖所 言:
我觉得还是学会一些底层逻辑比较好,这些插件的功能强大不可否认,但是通常遇到特殊 情况的时候就无法处理得到满意的结果。工具是很好的,只是不要过于依赖。 善用 Google 即是掌握了搜索的「底层逻辑」,而本章「搜索万花筒」里的宝贝们则是锦上 添花。认识到两者的主次关系,才能使搜索过程更加游刃有余。 所以本章节的价值即在于提供尽可能多领域的搜索「杀手锏」,同时扩展你对于搜索的认知 和想象。 ![寻找软件替代品——AlternativeTo 搜索框截图] (https://course.chongbuluo.com/.gitbook/assets/image%20%28211%29.png)
对一些无须单独介绍的搜索引擎就在此以列表的形式呈现,子节点还将陆续分享一些实用、 好玩儿的搜索工具,包括平台级的网站、数据库、插件等。这些独居创意的搜索产品设计也 许还会有助于激发你对搜索更多的想象和探索。
| 名称地址 | 备注 | | ------------------------------------------------------------ | ------------------------------------------------------------ | | KonaChan | 想要找个性化的动漫壁纸,只 有这种专业的动漫图片网站才有。 | | AlternativeTo | 寻找软件替代品。 | | 东京图书馆 | 动漫生肉第一时间基本能找 到。 | | SolidTorrents | 这个是我在逛 Reddit 时发现 的,看看[作者对产品的介绍] (https://www.reddit.com/r/torrents/comments/a4ehwc/introducing_solidtorrents_n ew_torrent_search/)。 | | 教你用百度 | [同类] (http://t.cn/EMe06dJ),你懂得。另外还有比较委婉一点儿的:[需要我帮你百度么] (https://lmbtfy.cn/)? | | 让我帮你 Google | 你怎么 不帮我搭个梯子呢 � | | whois 很多站 | 域名注册信息查询,对于 没有开启隐私保护的域名可以查到注册人信息。 | | Coursade | 实用又好用的在线公开课搜 索引擎,网站索引了 51163 个在线课程。 | | SimilarSiteSearch | 比如,你想知道还有哪 些网站提供类似 shazam 的歌曲反向搜索服务。 | | 伪射手 | 真射手华丽转型去做播放器了,接由 伪射手来提供字母检索下载服务。 |
| 名称地址 | 备注 | | ----------------------------------------------- | ------------------------------------------------------------ | | 磁力猫 | 站长隔三差五来找我,频繁换域名。怎么老 是你被 DNS 污染呢? | | 微盘搜索 | 微盘虽然看起来凉了,但其实是 丢卒保车。海量资源,尤其是考试相关都在。 | | SooHub | 从百度网盘爬取,界面设计能用英文 就不用中文,目测可以续命更久。 |
| 网站 | 备注 | | --------------------------------------------------------- | ------------------------------------------------------------ | | 国家企业信息公示系统 | 下面网站的数据来源, 体验不好,免费查看全部 | | 天眼查 | 可直接查询,全部功能需注册。 | | 企查查 | 可直接查询,全部功能需 注册。 | | 企信宝 | 可直接查询,全部功能需注册。 | | 社会信用代码公示查询平台 | 提供在我国境内依法注 册、登记的企业、个体工商户、事业单位、机关、社会组织及其他组织机构的基本信息。 |
![中国裁判文书网的搜索框] (https://course.chongbuluo.com/.gitbook/assets/image%20%2815%29.png) | 网站 | 备注 | | --------------------------------------------------------- | ------------------------------------------------------------ | | 中国裁判文书网 | 除涉及国家秘密、个人隐私 的、未成年人犯罪、调解结案以外的判决文书,各法院判决文书均应在该网站上公布。因该 网站为 “裁判文书网”,故仅适用于已届判决阶段的案件。另外全国网有时查不到,地方 网却可以查到,因此各省级法院网也可对这部分信息进行补充。 | | 审判流程信息公开网 | 可以查询本人 / 单位作 为当事人的全国法院受理案件的审判流程信息。 | | 中国执行信息公开网 | 可查询 2007 年 1 月 1 日以 后新收及此前未结的执行实施案件的被执行人信息。 |
在中文互联网世界的移动化进程中,由于百度的步履蹒跚,其搜索流量被三座体量庞大信息
孤岛所侵蚀。知乎、微博和微信逐渐崛起为移动搜索的三巨头,甚至有人将其中之一视为百
度的替代品。
在人们的潜意识里,通用搜索引擎偏重于搜索入口的工具属性,而「三巨头」则在工具属性
的基础上植入了资讯入口。相对于个性化的内容推荐,这些可以统称为「热搜」的榜单则提
供了另一种基于用户搜索行为的数据统计而来的信息流。热搜的价值是在互联网移动化的过
程中被发掘和放大的。反观百度搜索风云榜,则像是风尘度娘抖落的一粒尘埃。
![我猜知乎热搜下那么一大坨留白是给未来的品牌赞助商的]
(https://course.chongbuluo.com/.gitbook/assets/image%20%2870%29.png)
早年知乎的搜索功能饱受诟病,后来借助搜狗的技术支援才慢慢好转。之后随着对数据业务 的要求越来越高,知乎开始搭建自己的搜索引擎(扩展了解:[Chinese] RustCon Asia 2019 - Sun Xiaoguang: Search Engine in production with Rust)。这也 让更多人明白搜索引擎是一项门槛很高的技术,需要深厚的积累才能达到用户可以接受的程 度。 回到知乎搜索说特质,我认为是内容的可信赖度相对较高。尽管被冠以「逼乎、编乎」 等戴歪的帽子,但过滤掉营销内容,价值还是无处不在。比如很多虫友是通过知乎认识虫部 落的 * Web 搜索入口:
即便常常被人诟病娱乐致死,戏子当道...... 但不可否认,我们还是可以从中搜索到很多有用
的信息。我们常说「善用搜索」,即包括不以平台的内容导向为转移,而是取其所长,为我
所用。
微博对于实时新闻的传播影响力是其它社交平台无法比拟的。它是话题的引擎,可以在
很短时间牵引出大量的即时消息,人们从中各取所需。
天下熙熙皆为利来,天下攘攘皆为利往。有信息泛滥的地方,就不免有真真假假。如何辨识
内容的真实性是一个综合能力,绝非一个公式和模型所能提纲挈领。「善用搜索」在这里又
多了一层小心求证的意思。
Web 搜索入口:
说到微信,不知道各位平时斗图的表情都是从何而来呢?我呢,基本上靠盗图 + 遇到别人
发的极品表情就收藏之。我知道有些人为了斗图,还会去专门下载几百兆的表情包或者到淘
宝上买一包来挑选入库,总之由于习惯的原因,很多人和之前的我一样,以各种比较曲折的
方式来充实自己的斗图弹药库。其实...... 微信「搜一搜」中的表情搜索就蛮好用嘛。
这些表情基本都来自微信公众号文章中,紧跟潮流,斗图不落俗套,而且添加也很方便。另
外就是个人觉得「搜一搜」的表情搜索要比藏在表情菜单左下角 ➕ 图标里的表情搜索要更
魔性。因为后者的表情来自各种专辑,为了追求统一的风格,就显得没有前者那么海纳百
川。
下面聊聊微信公众平台的内容搜索。腾讯将这块内容大蛋糕只分给了搜狗,为后者补强了资
源优势。
Web 搜索入口:
- 虫部落快搜 - 搜狗微信
- 搜狗微信
相较于微信中的文章搜索,搜狗微信提供了具有更多结果筛选项的「搜索工具」,让用户可
以更精准地搜索到自己想要的信息。
案例:如何搜索特定微信公众号的文章(利用搜狗微信搜索) 扩展:微信指数上线:为什么那一天「喷子」们火了?
由于知乎的社交属性并不强,所以本节末尾乱入的「社交网络搜索」话题中将去掉知乎,引 入 QQ。说乱入是因为这个话题完全可以扩展为一个章节来展开讲述,但你知道这其中如果 没有案例那基本味同嚼蜡,而一旦要设计案例就会牵扯到个人隐私!我尝试过对隐私信息的 马赛克处理,结果发现让自己看下来都很难受。当然,最怕被人站在道德的制高点批评。所 以,这里仅从思路上提供一些可能有用的启发。 各位在社交网络中都会有自己唯一的 ID,就像身份证一样。ID 既是搜索的目标,也可能是 线索的发起点。
唯一 ID | 说明 |
---|---|
微信号 | 只能在确认且添加后方可查看 |
微博昵称 | 可搜索并查看博主的博文 |
QQ 号 | 一般也作为邮箱前缀 |
围绕一个 ID 的信息包括:性别、年龄、头像、位置、签名、教育信息等。当然这些信息也 | |
可能被人为刻意伪装过,特别是性别和年龄。 | |
我们一般先通过 Google 或百度搜索 ID 来寻找蛛丝马迹,社交网络随之开始扩张。知乎、 | |
豆瓣、天涯、facebook、网易云音乐、婚恋网站、贴吧...... 甚至某个论坛,都可能发掘出 | |
有用的信息。 | |
如今手机号已经成为注册社交账号的首选,随之带来的隐私安全问题也更多。而只要你的隐 | |
私保护意识还不够强,就可能会被人抓住尾巴。 | |
通过微博的「通讯录找人」、微信和 QQ 中的「添加手机联系人」,你都有可能轻易获知 | |
对方的 ID 信息。 | |
随着掌握信息的逐渐增多,ID 背后的人物画像也变得清晰。接下来,你还可以为画像打上 | |
一些标签,比如兴趣、朋友、工作、专业技能。这样你就可以结合已知的 ID 信息来进一步 | |
挖掘。比如你通过工作线索,了解到对方是企业老板,那么就可以通过[企查查] | |
(https://search.chongbuluo.com/)、天眼查等找到更多信息;再比如你通过兴趣线索,了 | |
解到对方有自己独立域名的博客,那么通过 whois 查询,你就可能找到注册相关的信息。 | |
![阮一峰博客的域名 whois 信息] | |
(https://course.chongbuluo.com/.gitbook/assets/image%20%28174%29.png) | |
以上即是一点简单的思路分享,具体到实际操作,还会有很多细节值得你去敏锐地将其捕捉 | |
到。特别是对于只有你熟悉的「陌生人」,这种敏感往往非所谓高手所具备,而正因为你对 | |
那个人「有感觉」 | |
最后,我想说无论是现实中白纸黑字的寻人启事,还是社交网络中的按图索骥的搜索,更重 | |
要的是带着情商:冷静的思考、成熟的取舍、引诱的策略...... 还有一颗善良的 ❤ |
对于维基百科,最简明的介绍莫过于「自由的百科全书」。它于 2001 年 1 月 15 日上线, 提供 303 种语言版本,是 Alexa 全球流量排名第 5 的网站(2019 年 6 月),大约 50%的 搜索引擎流量来自 Google,其中很大一部分与学术研究有关。它为人类创造了巨大的价 值,而这一切都是免费的 —— 维基百科是一个非营利组织。 ![2001年的维基百科界面] (https://course.chongbuluo.com/.gitbook/assets/image%20%2840%29.png)
注意以下几点有助于我们更好地使用和发掘维基百科。 ✅ 一般情况下,英文词条的内容要比其对应的中文词条的内容更为丰富。尤其是不局限于 地区的「国际化」词条。所以对于中文内容匮乏的词条,建议搜索和参考其对应的英文词 条。 比如 Asteroid vs [小行星] (https://zh.wikipedia.org/wiki/%E5%B0%8F%E8%A1%8C%E6%98%9F) ;Albert Einstein vs [阿尔伯特・爱因斯坦] (https://zh.wikipedia.org/wiki/%E9%98%BF%E5%B0%94%E4%BC%AF%E7%89%B9 %C2%B7%E7%88%B1%E5%9B%A0%E6%96%AF%E5%9D%A6)。 ✅ 而对于大陆之外的具有区域局限性的词条,其中文词条内容基本等于零,甚或处于待建 状态。所以,建议同上。 比如瑞士著名的旅游胜地: Lauterbrunnen vs [劳特布伦嫩] (https://zh.wikipedia.org/wiki/%E5%8A%B3%E7%89%B9%E5%B8%83%E4%BC%A6 %E5%AB%A9)。 ✅ 词条目录中的「参见 / See also」和「外部链接 / External links」(注意不是 「参考链接」)常常是打开当前词条新世界大门的钥匙。 比如在 Moon 的 External links 中可以发现 相关的制图资源和观察工具。
虫部落快搜一直保留着英文维基百科的搜索入口,但是在 4 月底维基英文版也躺入了 404 名单。有一直在用 Wikipedia 的网友以为是网卡了,看新闻方知这回 Wikipedia 的所有语 种版本都已被禁(源自:《Wikipedia blocked in China in all languages》 BBC News )。
推荐使用付费 VPN,省心。
Kiwix **** 是免费、跨平台的离线阅读器。可以让你随身携带一部汇集人类智慧的百科全
书。
无论您走到哪里,Kiwix **** 都能让您随时掌握整个维基百科!在一条船上,在茫茫荒野中
或在监狱里,Kiwix 让您可以获得全人类的知识。您不需要互联网,一切都存储在您的计算
机,USB 闪存驱动器或 DVD 上!
Kiwix 真的很容易使用。它提供了一系列使用舒适的功能:
- 全文搜索引擎
- 书签和注释
- HTTP 服务器
- PDF / HTML 导出
- 用户界面超过 100 种语言
- 标签导航
- 集成的内容管理器和下载器
- Windows
- macOS
- Android( F-Droid、 [Aptoide](http://apps.store.aptoide.com/app/market/org.kiwix.kiwixmobile/26/104 03289/Kiwix%2C+Wikipedia+offline)、Opera Mobile Store)
- iOS
- GNU/Linux(32 bits binaries、64 bits binaries)
互联网时光机是一个文艺的叫法,即是指保存着绝大部分网站的历史网页快照的数据库。 Wayback Machine 是其中的代表。
这里搜集了几个专门存储网页快照并提供查询服务的网站。通俗讲,它们可以帮你看到现存
或已失效的网页 —— 过去长什么样子?甚至可以下载到网页上文件。
| 名称地址 | 备注 |
| ------------------------------------------- |
------------------------------------------------------------ |
| Wayback Machine | 参见:Archive.org 20 年:记录互联
网风云变幻的时光机。截至目
前,他们已经保存了从 1996 年至今的超过 3490 亿张过往的网页快照 |
| Webpage archive | 保存的页面没有活动元素,也没有脚本,所
以它们可以保证您的安全,因为它们不能有任何弹出窗口或恶意软件 |
| WebCite | Wayback Machine 使用机器人在特定时
间自动存档某些网页,并接受由用户请求发起的存档过程;WebCite 则需要有人主动归档
链接。 |
## 案例
请帮助知乎 ID 为「贤枫 imyzf」这位网友找回这个已经 404 的 Flash 源文件(格式后缀为
.swf),注意是源文件!(作答该问题只需将源文件以邮件附件的形式发送即可)。
点击谷歌 -- 寄语页面的 flash 链接,发现已经 404 了 �

不一定!我们可以尝试利 Wayback Machine 来找回这个 Flash 文件。在 Wayback
Machine 的搜索框中粘贴链接:http://googlechinablog.com/gugeflash.swf 。回车
可见,最早的记录点在 2006.4.17,也就是 Google 官方博客发布「寄语」后第 3 天。点
击!惊喜地发现 —— 文件瞬间自动下载到了本地!如下图:

是的,Wayback Machine 可以回到过去,回到记忆里的那个地方,捡回丢失在现实的宝贵
文件。当然,本案例还有其它解答途径,在前面已经提到过。
代码托管你用不着,同性交友你没这爱好,但用好 GitHub 的搜索,对于技术或非技术人员 都是大有裨益的。 GitHub 的搜索功能可谓强大。你可以在 GitHub 进行全局搜索,或将搜索范围限定在特定 的仓库中。
- 要在所有 GitHub 中全局搜索,请在任意页面顶部的搜索字段中键入您要查找的内容,然 后在搜索下拉菜单中选择 “All GitHub”。
- 要在特定存储库或组织内进行搜索,请导航到存储库或组织页面,在页面顶部的搜索字段 中键入要查找的内容,然后按 Enter 键。 用户必须登录才能在所有公共存储库中搜索代码。 GitHub 上无法搜索 GitHub Pages 的内 容。但是,如果源内容存在于存储库的默认分支中,则可以使用代码搜索来搜索源内容。有 关更多信息,请参阅 搜索代码 。
- [新大陆:如何在 GitHub 上搜索一些很赞的项目] (https://www.chongbuluo.com/thread-5179-1-1.html)
- [6 条 Tips 为你打开 GitHub 寻宝地图] (https://www.chongbuluo.com/thread-5758-1-1.html)
你可以在 GitHub 所有的公共仓库和你有权访问的私有仓库中搜索以下 7 种类型的信息:
- Repositories
- Topics
- Issues and pull requests
- Code
- Commits
- Users
- Wikis 以上类型内容的搜索方式细节将在子目录中逐一展开介绍。
这里可以了解一些搜索语法,会对你的精准查询有所帮助。
您可以使用 >
,>=
,<
,和 <=
搜索是大于,大于或等于,小于和小于或等于另一个
值的值。
匹配条件 | 举例 |
---|---|
> n |
cats[ **stars:> |
1000**](https://github.com/search?utf8=%E2%9C%93&q=cats+stars%3A%3E1000 | |
&type=Repositories) 匹配超过 1000 star 的包含 “cats” 关键字的仓库。 | |
>= n |
[**cats topics:> = |
5**](https://github.com/search?utf8=%E2%9C%93&q=cats+topics%3A%3E%3D5&t | |
ype=Repositories) 匹配具有 5 个或更多主题的单词 “cats” 的存储库。 | |
< n |
****[**cats |
size:<10000**](https://github.com/search?utf8=%E2%9C%93&q=cats+size%3A%3 | |
C10000&type=Code) 匹配小于 10 KB 的文件中带有 “cats” 字样的代码。 | |
<= n |
[**cats stars:<= |
50**](https://github.com/search?utf8=%E2%9C%93&q=cats+stars%3A%3C%3D50 | |
&type=Repositories) 匹配具有 50 个或更少 star 的包含 “cats” 关键字的仓库。 | |
您还可以使用[范围查询] | |
(https://help.github.com/en/articles/understanding-the-search-syntax#query-for-v | |
alues-between-a-range)来搜索大于或等于,或小于或等于另一个值的值。 | |
搜索语法 | 举例 |
--------- | ------------------------------------------------------------ |
n ..* |
****[**cats stars:10 .. |
***](https://github.com/search?utf8=%E2%9C%93&q=cats+stars%3A10..*&type= | |
Repositories) 相当于 stars:>=10 并匹配具有 10 个或更多星的 “猫” 一词的存储库。 |
|
*.. n |
[cats **stars:* .. |
10**](https://github.com/search?utf8=%E2%9C%93&q=cats+stars%3A%22*..10%2 | |
2&type=Repositories) 相当于 stars:<=10 和匹配具有 10 个或更少恒星的单词 “cats” |
|
的存储库。 |
(https://help.github.com/en/articles/understanding-the-search-syntax#query-for-v
alues-between-a-range)
您可以使用范围语法搜索范围内的值,其中第一个数字 n 是最低值,第二个数字是最高
值。n..
n
询问 | 举例 |
---|---|
n .. n |
****[**cats |
stars:10..50**](https://github.com/search?utf8=%E2%9C%93&q=cats+stars%3A10.. | |
50&type=Repositories) 匹配存储库,单词 “cats”,有 10 到 50 颗星。 |
(https://help.github.com/en/articles/understanding-the-search-syntax#query-for-d
ates)
您可以搜索日期,除另一个日期,或者那年秋天日期范围内较早或较晚的是,通过使用 >
,>=
,<
,<=
,和[范围查询]
(https://help.github.com/en/articles/understanding-the-search-syntax#query-for-v
alues-between-a-range)。日期格式必须遵循 ISO8601 标准,即 YYYY-MM-DD
(年 -
月 - 日)。
询问 | 举例 |
---|---|
> YYYY-MM-DD |
[cats **created:> |
2016-04-29**](https://github.com/search?utf8=%E2%9C%93&q=cats+created%3A | |
%3E2016-04-29&type=Issues) 匹配 2016 年 4 月 29 日之后创建的 “cats” 一词的问 | |
题。 | |
>= YYYY-MM-DD |
****[**cats created:> = |
2017-04-01**](https://github.com/search?utf8=%E2%9C%93&q=cats+created%3A | |
%3E%3D2017-04-01&type=Issues) 匹配 2017 年 4 月 1 日或之后创建的 “cats” 一词 | |
的问题。 | |
< YYYY-MM-DD |
[**cats |
pushed:<2012-07-05**](https://github.com/search?q=cats+pushed%3A%3C2012-0 | |
7-05&type=Code&utf8=%E2%9C%93) 匹配代码与 2012 年 7 月 5 日之前推送到的存 | |
储库中的 “cats” 一词。 | |
<= YYYY-MM-DD |
[cats |
created](https://github.com/search?utf8=%E2%9C%93&q=cats+created%3A%3 | |
E%3D2017-04-01&type=Issues)[:**<= | |
2012-07-04**](https://github.com/search?utf8=%E2%9C%93&q=cats+created%3A | |
%3C%3D2012-07-04&type=Issues) 与 2012 年 7 月 4 日或之前创建的 “cats” 一词相 | |
匹配。 | |
YYYY-MM-DD .. YYYY-MM-DD | [**cats |
pushed**](https://github.com/search?q=cats+pushed%3A%3C2012-07-05&type=C | |
ode&utf8=%E2%9C%93)[:2016-04-30..2016-07-04](https://github.com/search? | |
utf8=%E2%9C%93&q=cats+pushed%3A2016-04-30..2016-07-04&type=Repositori | |
es) 匹配 2016 年 4 月底到 7 月期间被推到 “cats” 字样的知识库。 | |
YYYYYYYY-MM-DD..* |
[**cats |
created**](https://github.com/search?utf8=%E2%9C%93&q=cats+created%3A2012 | |
-04-30..*&type=Issues)[:**2012-04-30 .. | |
***](https://github.com/search?utf8=%E2%9C%93&q=cats+created%3A2012-04-3 | |
0..*&type=Issues) 匹配 2012 年 4 月 30 日之后创建的包含 “cats” 字样的问题。 | |
*.. YYYYYYYY-MM-DD |
[**cats |
created**](https://github.com/search?utf8=%E2%9C%93&q=cats+created%3A2012 | |
-04-30..&type=Issues)[:** .. | |
2012-04-30**](https://github.com/search?utf8=%E2%9C%93&q=cats+created%3A | |
*..2012-07-04&type=Issues) 匹配 2012 年 7 月 4 日之前创建的包含 “cats” 字样的问 | |
题。 | |
您还可以 THH:MM:SS+00:00 在日期之后添加可选时间信息,以按小时,分钟和秒搜 |
|
索。那是 T ,然后是 HH:MM:SS (小时 - 分 - 秒)和 UTC 偏移(+00:00 )。 |
|
询问 | 例 |
----------------------------------------- | |
------------------------------------------------------------ | |
YYYY - MM - DD T HH : MM : SS + 00 : 00 |
[cats |
created](https://github.com/search?utf8=%E2%9C%93&q=cats+created%3A%3 | |
E%3D2017-04-01&type=Issues)[:**2017-01-01T01:00:00 + 07: | |
00..2017-03-01T15:30:15 + | |
07:00**](https://github.com/search?utf8=%E2%9C%93&q=cats+created%3A2017-0 | |
1-01T01%3A00%3A00%2B07%3A00..2017-03-01T15%3A30%3A15%2B07%3A00&t | |
ype=Issues) **** 匹配 2017 年 1 月 1 日凌晨 1 点之间创建的问题,UTC 偏移量为 | |
07:00 3 月 1 日,2017 年下午 3 点,UTC 偏移量为 07:00 。 |
|
YYYY - MM - DD T HH : MM : SS Z |
[cats |
created](https://github.com/search?utf8=%E2%9C%93&q=cats+created%3A%3 | |
E%3D2017-04-01&type=Issues)[:**2016-03-21T14:11:00Z..2016-04-07T20:45: | |
00Z**](https://github.com/search?utf8=%E2%9C%93&q=cats+created%3A2016-03 | |
-21T14%3A11%3A00Z..2016-04-07T20%3A45%3A00Z&type=Issues) 匹配 2016 年 3 | |
月 21 日下午 2:11 和 2106 年 4 月 7 日晚上 8:45 之间创建的问题。 |
(https://help.github.com/en/articles/understanding-the-search-syntax#exclude-cert
ain-results)
您可以使用 NOT
语法排除包含特定单词的结果。该 NOT
操作只能用于字符串的关键
词。它不适用于数字或日期。
询问 | 例子 |
---|---|
NOT |
[hello NOT |
world](https://github.com/search?q=hello+NOT+world&type=Repositories) 匹配有 | |
“hello” 这个词而没有 “world” 这个词的仓库。 |
如果您的搜索查询包含空格,则需要用引号括起来。例如:
- [cats NOT "hello world"](https://github.com/search?utf8=%E2%9C%93&q=cats+NOT+%22hello+w orld%22&type=Repositories) 匹配存储库的单词 “cats” 而不是 “hello world”。
- [构建标签:“bug fix”] (https://github.com/search?utf8=%E2%9C%93&q=build+label%3A%22bug+fix%22 &type=Issues) 与 “build” 一词的问题相匹配,其标签为 “bug fix”。
GitHub 高级搜索提供了可视化的查询界面。 可以通过各种条件过滤搜索结果,例如星号或
仓库中的分叉数。 在填写高级搜索字段时,查询语句将自动在顶部搜索栏中生成。
Sci-Hub 是一个学术文献搜索网站,通过镜像官方资源,可以免费访问数百万份研究论文和
书籍,通常以各种方式绕过出版商的付费要求。
Sci-Hub 由 Alexandra Elbakyan 于 2011 年在哈萨克斯坦成立,通过绕开查阅论文过程中
付出的高额付费成本,Sci-Hub 随即被广泛传播,尤其备受高校学生群体的青睐,毕竟免费
谁不喜欢?截至 2016 年 2 月每天提供超过 200000 个请求。
Sci-Hub 的可用网址就跟打游击一样,隔三差五就会更换。所以有「雷锋」干脆上线了一个 https://whereisscihub.now.sh/ 的网站。在此你可以看到最新可访问的 Sci-Hub 地 址。
- 官方 Twitter:https://twitter.com/Sci_Hub
Kopernio 和 Unpaywall 是两个与 Sci-Hub 殊途同归的浏览器插件。可以实现绕过付费 墙,免费获取全文。
名称 | 插件平台 |
---|---|
Kopernio | Chrome & Firefox |
Unpaywall | Chrome & Firefox |
Open-i 是美国国家医学图书馆提供的一项医学检索服务,可以从开源文献和生物医学图像 集中搜索和检索摘要和图像(包括图表,图形,临床图像等)。可以使用文本查询以及逆向 图像查询来完成搜索。Open-i 可以访问来自约 120 万篇 PubMedCentral 文章的 370 多 万张图片;7470 例胸部 X 光检查,共有 3955 例放射学报告;来自 NLM History of Medicine 收集的 67,517 张图片;和 2,064 个骨科插图。
- 官网:https://openi.nlm.nih.gov/
- 学术搜索:https://scholar.chongbuluo.com/#open-i
Open-i 生物医学图像搜索引擎不仅可以检索 MEDLINE 引文信息,还可以检索文章中的结
果语句以及最相关的图形。此外,可以使用该图作为查询组件来查找其他相关图像或其他视
觉上相似的图像。
正向的,可以用关键词搜索文献引文信息和相关图像。比如搜索 tumor
,就可以得到大量
肿瘤病状的医学影像。
逆向的,Open-i 还可以识别和分析你上传的图像,以下面这张图为例:
糖尿病视网膜病变患者视网膜基底造影示例。左侧图片采自眼部正常的糖尿病患者(A);
右侧图片采自患有视网膜病变的糖尿病患者(B),图中显示出该病人眼底有出血现象(一
些小红点)。图片来自 Google Research Blog。
搜索结果中列正了大量的视网膜病变影像,每一张眼底图像都有详细的说明。同时,对于从
事深度学习在医学方面的辅助诊断研究的工程师来讲,Open-i 也提供了数量可观、质量上
乘的图像数据。对了!Open-i 还提供了专门的数据集下载。
| 来源 | 类别 | 下载 | | -------------------------- | ------------- | ------------------------------------------------------------ | | 印第安纳大学医院 | 胸部 X 光图像 | PNG 图片:[链接] (https://openi.nlm.nih.gov/imgs/collections/NLMCXR_png.tgz);DICOM 图片:链 接 | | 蒙哥马利县健康与人类服务部 | X 射线照片 | [链接] (https://openi.nlm.nih.gov/imgs/collections/NLM-MontgomeryCXRSet.zip) | | 深圳市第三医院 | X 射线图像 | [链接] (https://openi.nlm.nih.gov/imgs/collections/ChinaSet_AllFiles.zip) |
扒皮?这个需求说得太恶俗了。我们还是用「社交网络搜索」代替吧。具体即如何通过某用 户的微博图片,来反查其个人主页。 有人会说图片如果有水印,那不就用不着了。不完全对,要是博主把昵称改了呢?这个 Chrome 插件可以帮到你。即使原 Po 将图片删除了,我们依然可以通过反查跳转到的网址 找到其主页。 还有一点!微博相册常被用作图床,那么外链微博图片就可以通过这种方式来找到发图的博 主。
![快捷操作置入右键菜单中] (https://course.chongbuluo.com/.gitbook/assets/weibo-search.png) 点击 查看 po 主,跳转到其个人主页:https://weibo.com/dbreath
插件地址:[微博图片反查] (https://chrome.google.com/webstore/detail/%E5%BE%AE%E5%8D%9A%E5%9B% BE%E7%89%87%E5%8F%8D%E6%9F%A5/egbnikffkpbahjabjhgblnfgbcnckjop) (Chrome 网上应用商店) 项目地址: https://github.com/fei-ke/WeiboImageReverse
Ecosia 是一个综合搜索引擎,于 2009 年 12 月 7 日首次推
出,总部设在德国柏林。 其搜索结果和搜索广告均由微软 Bing 提供,并由该公司自己
的算法增强。
Ecosia 在其搜索结果旁边显示广告,用户每发起一次搜索请求,所产生的广告收入都将被
用于在全球范围内种植树木。官方说明大约每 45 次搜索就会种下一棵 .
在搜索窗口中输入 关键词 #w
,Ecosia 将直接转到维基百科的词条页面,这是一个很酷的
捷径!这是 Ecosia 特有的搜索标签功能,它可让你快速访问外部结果。下面是一个标签清
单:
搜索标签 | 功能用途 |
---|---|
#fb | 带您到 Facebook 搜索特定的关键字或网站 |
#finance | 将带您直接进入雅虎财经搜索结果 |
#g | 为 Ecosia 上的 Google 选项卡 |
#gb | 将直接带您进入 Google 图书搜索结果 |
#go | 直接带你到 Google 的 I‘m felling lucky 结果 |
#i | 直接显示图片 |
#m | 会显示你正在搜索的任何地图 |
#n | 有关你搜索的主题的新闻 |
#tr | 将带你直接进入 Google 翻译对于你的搜索 |
#tw | 将带你到你的搜索的 Twitter 结果 |
#v | 直接显示视频 |
#w | 将带你到相关的维基百科文章 |
#walpha | 将带你直接到 Wolfram Alpha 搜索结果 |
#yt | 将带你直接到您搜索的 YouTube 结果 |
有时候看到一个符号,却叫不上名字,也无法用关键词给度娘或者 Google 形容,该怎么办 呢?让我们回到人类文明记载的最初方式 —— 象形文字 —— 画图搜索! 我们使用的最佳工具时 ——shapecatcher。
在 Drawbox 框里画出你想要搜索的特殊符号的样子,然后点击左下角的
Recognize 按钮,马上就会根据你画的样子搜索出相关的符号来,下方结果会有一大堆
相关符号,只要你画的比较规范,肯定能找到想要的符号!
注意:如果你搜索出来的符号无法展示,那么说明你本地的字库没有相关的字型,从该网站
的下载页面找到 Unicode 字型库安装即可。
| 名称地址 | 备注 | | ------------------------------------------------------------ | ------------------------------------------------------------ | | 求字体 | 中文字体识别最好的,据说锤子 手机自带的识别功能用的就是求字体的 API。 | | What The Font | 英文字体识别最全 的 | | [WhatFont-Chrome 扩展程序] (https://chrome.google.com/webstore/detail/whatfont/jabopobgcpjmedljpbcaablp mlmfcogm?hl=zh-CN) | 更方便 |
- 字与字之间要有空隙,不要连在一起
- 文字不要带有与填充色不同的描边
- 背景尽量保持简单,复杂背景要简化
- 文字尽量保持水平
![我在社区出的第一期题目中用到的一张素材]
(https://course.chongbuluo.com/.gitbook/assets/image%20%28114%29.png)
请问:下图中文字的字体名称是以哪位明星的姓名来命名的?—— 方正徐静蕾体,即是以
徐静蕾的名字命名的。
很多人都见过徐静蕾体,甚至有喜欢模仿的。所以我刻意在此用了英语字母,降低肉眼辨
识度。
听到好听的歌曲却不知其名,通过何种搜索方式可以找到歌名?这就是歌曲方向搜索所要讨 论的话题。
和图片反向搜索一样,网络上也有很多歌曲识别软件。
名称 | 平台 |
---|---|
网易云音乐、QQ 音乐... | App |
[AHA | |
music](https://chrome.google.com/webstore/detail/aha-music-music-identifie/dpa | |
canjfikmhoddligfbehkpomnbgblf?hl=zh) | Chrome 插件 |
Shazam | App、macOS |
Soundhund | App |
AHA music:Chrome 插件,查询当前网页视频正在播放的背景音乐。 | |
Shazam 和 Soundhund 都是老牌软件,曲库丰富,识别率高。不过对于中文歌曲的支持 | |
就有些差强人意了。 |
用户评价:有一次找苹果广告里的插曲,试了其他软件都没找到,只有 Shazam 给 了一个油管链接,居然是一部 30 年前的苏格兰电影插曲,不得不服。
Linggle 是台湾清华大学的学术团队研发的语言搜索引擎。可以为
用户分析得出更准确的英文写作建议,能够根据词性来分析最佳搭配的词或短语。
关于 Linggle 的具体使用方式,其网站主页给出了如下 5 种。
只要在你想要插入单词的位置使用 _ 来查询即可。
不确定 “I would like to discuss about the issue.” 这个句子中的 “discuss” 后面到底 需不需要加 “about” ?使用 Linggle,在你不确定的词前加上 ? ,Linggle 就就会告 诉你需不需要这个词!
固定的介词搭配太多,常常搞混。如果不确定某个介词短语的搭配,使用 Linggle,只需要 在你要选择的两个词中间加入 / 就可以了!当然不只是介系词,其他词性的也可以。
Linggle 最大的特色,就是可以使用「关键词」配合「特定词性」来查询各种搭配词。比 如,可以用 v. death penalty 来查询 “death penalty” 搭配的动词。
想要更加精确的查询搭配词,就要使用复杂的查询式,例如在想要查询的动词前加上一个 “to”。
所谓隐私保护搜索引擎,通俗讲即是在用户发起搜索请求的过程中,不跟踪用户的行为,不 记录用户的数据。在如今个人隐私越来越受到人们重视的背景下,一些打着隐私
Qwant 是法国人创建的,成立于 2013 年,听说法国政府采用了它作为机构使用的引
擎,是三者中的最新成员。
Startpage 成立于荷兰。成立于 1998 年(虽然有不同的名称,直到 2016 年)。它从
Google 获得(购买)其搜索结果。就搜索建议和即时答案而言,它是非常准确的。
每次人们对 Google 不满时,DuckDuckGo 都是你最常听到的。它于 2008 年在美国
成立,并不像其他两个一样闻所未闻,但毫无疑问它是三者中功能最丰富的。
名称 | 描述 | 评级 |
---|---|---|
DuckDuckGo | 被大陆屏蔽,隐私保护搜索的带头大哥 | |
★★★★☆ | ||
Startpage | 不保存 Cookie,也不跟踪记录 | |
★★★☆ | ||
Qwant | 相对前两者知名度更低一些,但我实测还很 | |
不错 | ★★★★☆ | |
对于大多数人来说,DuckDuckGo 比 Google 更差。但不是所有的。例如,Google 隐藏 | ||
了磁力网站和盗版内容等网站。因此,要查找具有盗版或色情内容的网站,DDG 要好得 | ||
多。 | ||
再说回隐私保护,DDG 还不足以让你完全摆脱 Google 带来的隐私困扰 —— 前提是正在 | ||
用着 Chrome 浏览器 所以,DuckDuckGo + Firefox 看起来就比较稳妥了。 |
RSS(最常见的扩展为 Really Simple Syndication)是一系列 Web Feed 格式,用于 以标准格式发布经常更新的作品,如博客条目,新闻标题,音频和视频。RSS 文档(称为** 提要**、网络订阅源或频道)包括完整或摘要文本,以及发布日期和作者身份等元 数据。Web Feed 允许他们自动联合内容,从而使发布商受益。总之,RSS 被其忠实拥趸 视为真正简单的信息整合。 ![RSS 的标识] (https://course.chongbuluo.com/.gitbook/assets/image%20%28144%29.png)
有利于希望从喜爱的网站及时收到更新或从多个站点聚合数据的用户。
用户通过在阅读器中输入提要的 URL 或通过单击启动订阅过程的 Web 浏览器中的提要图 标来订阅提要。
| 名称 | 特色描述 | | ------------------------------------------------------------ | ------------------------------------------------------------ | | RssSearchHub | 提供 Feed 排名,智能的 Feed 排名算法会帮助用户找到感兴趣的主题 | | Feedi( GitHub) | 目前有 100 个订阅源和 大约 30k 条目,但任何用户都可以通过 API 添加 | | Instant RSS Search | 测试时不可用... 网站故障?姑且 暂列其中吧。基于 Google,支持中文 | ![RssSearchHub 的个人控制面板] (https://course.chongbuluo.com/.gitbook/assets/image%20%28248%29.png)
尽管 RSS 有诸多优势,也备受部分极客群体和互联网原住民的喜爱,但不可否认的事实 是:RSS 已经日薄西山。除 IE 之外主流浏览器(Chrome、Firefox)均已不支持 RSS,还 有诸如 Twitter、facebook 等大站也已减少或取消了对 RSS 的支持。 总之,技术发展总是向着更好地服务人的目标。未来,信息的过滤、聚合形态会更加多样 化。
元搜索引擎(Metasearch engine)将用户的 Query 同时提交给多个独立的搜索引擎(如 Google、Yahoo、百度),然后同时检索多个数据库并对全部结果进行二次加工(去重、 排序等),最后输出在一个统一的界面。通俗说,即是对搜索引擎进行搜索。 ![元搜索引擎的架构] (https://course.chongbuluo.com/.gitbook/assets/image%20%2837%29.png) 作为搜索引擎按功能划分的一个分支,元搜索引擎的存在感越来越弱。虽然时不时会冒出「 新贵」捕获「马克党」的眼球,但鲜有在使用体验上有大幅提升的。
通过向多个其它搜索引擎发送 Query,从而扩展了主题的搜索范围,理论上会得到更多结 果。与此同时,还减少了用户 Query 的重复输入。 但「得到更多结果」的理论实际上在很多时候是一种错觉。特别是如果用户正在搜索时下流 行或常见信息,通常以搜索引擎的多个相同结果结束。用户使用高级搜索语法进行搜索也很 难与 Query 一起进行请求,因此结果可能不如用户在 Google、百度上使用高级搜索界面 时那样精确。这导致许多元搜索引擎不具有高级搜索功能。
名称 | 语言 |
---|---|
InfoSpace | 英语 |
WebCrawler | 英语 |
Dogpile | 英语 |
Excite | 英语 |
Searx | 多种语言 |
![元搜索引擎 Dogpile 的搜索框界面] | |
(https://course.chongbuluo.com/.gitbook/assets/image%20%28251%29.png) |
在 Google 搜索运算符一节有过完整的表格,这里结合最新的效果测试,来用表格完整 梳理和总结下这些搜索指令的功能。排序则按照我个人认为的被使用频率的由高到低。
指令 | 作用 | 示例 |
---|---|---|
“” | 完全匹配 | "让搜索更简单" |
- | 排除 | 正则表达式 -CSDN |
site: | 在指定网站或域名下搜索 | 奇技淫巧 site:chongbuluo.com ;图书馆 |
site:edu.cn | ||
filetype: | 限定搜索结果的文件格式 | 丰乳肥臀 filetype:pdf;爱 filetype:avi 00 |
0 |
|
| inurl: | 在包含指定关键词的网址中搜索 | 人口 inurl:report pdf |
| * | 模糊匹配 | 我觉得基本可以弃用 |
虽然这些搜索指令被很多人包括自媒体冠以各种浮夸的「神奇效果」。但我更建议各位在自
己的实际使用中多管齐下,而非执着于这些指令。比如,你在 Google 搜索中应用 site: 来
搜索某个站点的信息,未必就比网站自身提供的站内搜索好用。虽然中文站点的站内搜索普
遍做得很烂,但其老旧的站内索引设计也许就是要比懒得抓取该站点的 Google 爬虫要全面
一些。
Google 搜索地区重定向 /ncr
由于 VPN 线路等原因,你使用的 Google 可能被定向到了日本?加拿大?甚至摩纳哥!都
有可能。不喜欢这样被摆布的感觉?在浏览器地址栏输入 google.com/ncr
即可重定向到
「原汁原味的美式 Google」 。
Ctrl/command` + `F
浏览器、Office 办公套件... 几乎一切包含文本信息的界面!快速锁定关键词位置,查看
关键词密度,Ctrl/command
+ F
都可以快速帮你搞定。
e
通过搜索引擎召唤计算器的妙招,这次来个横向评测!
至于为什么在各个搜索引擎搜 e
都能得出一个计算器的「最佳匹配」,我也不得而知。不
过 e
的确是一个伟大的字母常数!
在 Google 搜索中,通过 inurl:view.shtml
你可以找到在线的网络摄像头。
注意养成对网址的敏感,有助于你通过改变域名后缀或者删减目录来找到目标信息。
比如:Google 于 2013 年愚人节所推出的恶搞[
](https://zh.wikipedia.org/wiki/Google%E7%8E%A9%E7%AC%91%E5%92%8C%E5%
A4%8D%E6%B4%BB%E8%8A%82%E5%BD%A9%E8%9B%8B%E5%88%97%E8%A1%
A8#cite_note-33)Google Nose BETA,它号称为一个试验计划,提供了一个香味数据
库。Google 灵鼻子是一个由约 1500 万个气字节所建构的香味数据库,并透过 Google 街
景车记录空气中的气味并创建索引。在网上可以查到当年这个项目的网址是:
https://www.google.com/landing/nose/
状态:404
然后,你已知 Google 常常把一些要废弃掉的页面存档起来,即:www 换做 archive !于
是改变域名:
[https://archive.google.com/landing/nose/
](https://archive.google.com/landing/n
ose/) 状态:404
还是 404 ... 观察网址的目录结构... 呃... 删掉 landing 试试?Amazing!
脱离购物搜索的惯性意识,从另一个维度看,淘宝也是一个称职甚至优秀的数据和资料的获 取途径。
- 电子元器件资料:芯片、传感器、摄像头... 各种电子元器件的型号分类、规格参数、 竞品对比... 应有尽有。
- 电子设备配置教程 —— 买任何电子设备,哪怕一根连接线,你都能在商品详情页找 配置教程,这些教程经过万千消费者亲测,通俗易懂,实用可行,最关键是说人话,不会刻 意卖弄专业知识个人奋斗史或者嘲讽电子小白。
- 数码家电如何操作:前台小姐姐喊你给打印机墨盒装墨,你不会?也不能说不会!淘 宝搜索一款打印机,客服可能会为你呈上视频演示,文档什么的都懒得看。 总之,你学习生活中涉及到的任何商品的相关问题,都可以根据商品的独有的 ID 在淘宝搜 到其相关资料。如果商品详情页信息不购,还有客服、店长。
出于各种需要,我们有时会需要在电脑端网页完成一些操作。但网站没有提供或者暂时关闭
了网页版。比如升级期间停止访问网页版的[微博指数搜索]
(http://data.weibo.com/index/)。
这时,你可以打开浏览器的控制台,点击调试窗口左上角的转换设备图标,然后刷新页
面,即可使用移动端可正常访问的服务。
此操作一劳永逸,适用于网页端搜索,只需两步:
- 使用油猴脚本 : [Tampermonkey](https://chrome.google.com/webstore/detail/tampermonkey/dhd gffkkebhmkfjojejmpbldmpobfkfo?hl=zh-cn)(For Chrome), Greasemonkey (For FireFox:);
- 再添加脚本 [Google Hit Hider by Domain(Search Filter / Block
Sites)](https://greasyfork.org/en/scripts/1682-google-hit-hider-by-domain-search-f
ilter-block-sites)。该脚本支持 Google,Bing 与百度搜索。
安装了插件或脚本后,可以在搜索结果页手动屏蔽指定网站(点击 block 按钮),或导入
屏蔽列表。
2019 年 4 月 12 日民谣歌手李某被全网封杀。虽然我谈不上逼粉,但是逼哥的音乐陪伴我
度过间歇性的困顿日子。一番搜索,从一位微博博主那里获得了逼哥的歌曲打包下载链接。

我激动地点开却是渣浪的 404 页面... 又试了两次,还是 404 � 就在对链接失效太快的抱
怨中关掉页面时,瞥见这个百度云链接似乎有问题!
不是空格解析而来么,这回
只复制
前面一段打开,果然!

这里就引申出一个普遍性的问题:超链接会与其尾部紧跟的西文字符自动拼合成一个新的
链接,而这个新链接有极大概率会是 404 not foud
。这就提醒我们无论在自己书写,或
是遇到类似问题时,多多留神,避免造成无谓的信息阻断。
去年翻看过一本 Tesla & Space X 创始人马斯克的传记《硅谷钢铁侠》。在书中彩色印刷
的前几页中有这么一段掌故。
1984 年,马斯克年仅 12 岁,当时他还生活在南非,在这个小学还没毕业的年纪就曾经编
写过一款名叫《Blastar》的小游戏。最后,这款游戏被马斯克以 500 美元的价格卖给了《
PC and Office Technology》杂志。
时隔 30 多年,这本传记的作者 Ashlee Vance 从马斯克的母亲 Maye Musk 手中得到源代
码,然后 Google 工程师 Tomas Lloret 基于这段原始代码重制了 HTML5 版本的游戏。
游戏传送门:http://blastar-1984.appspot.com/
请问:这位前 Google 工程师的电子邮件地址是?
Google 搜索 Tomas Lloret google email
获得两个主要包含其邮箱信息的网址:
- https://rocketreach.co/tomas-lloret-llinares-email_9903307
- https://www.contactout.com/Tomas-LloretLlinares-61052716 再用 Google 账号登录即可查看。
题目中提到「Tomas Lloret 基于这段原始代码重制了 HTML5 版本的游戏」,可能是程序 思维使然,不妨看看网页源代码?于是在头部发现 ——
<!DOCTYPE html>
<html>
<head><title>Blastar for HTML5: a web version of Elon Musk's 1984 video
game</title>
<link rel="stylesheet" href="css/style.css">
<script>
// Copyright 2015 Tomas Lloret ([email protected])
嗯,第 6 行注释的版权信息里,时间、姓名,还有我们想获知的邮件地址都有! 不成文的规律:一般在个人程序作品中,作者会注释版权信息。其中可能包括:时间、 姓名(昵称)、邮件地址等。
以下举例几个典型的日常搜索需求,请各位尝试解答。 0⃣ 在 Google 和百度中分别搜索《爱在日落黄昏时》这部影片的可免费在线观看的地址; 1⃣ 在 Google 和百度中分别搜索《巴黎圣母院》这本书的可免费下载的任意电子版地址; 2⃣ 在 Google 和百度中分别搜索《权利的游戏》第八季第六集的可免费下载的种子文件;
后缀名 | 类别用途 |
---|---|
txt / doc / pdf | 文档 |
mobi / chm / epub / pdf | 电子书 |
torrent | 种子 |
avi / mkv | 视频 |
序号 | 关键词 | 搜索引擎 | 结果 |
---|---|---|---|
0⃣ | 爱在日落黄昏时 filetype:mkv | 9 | |
Before Sunset filetype:mkv | 9 | ||
1⃣ | 巴黎圣母院 filetype:mobi | 9 | |
巴黎圣母院 filetype:mobi | 百度 | : | |
2⃣ | 9 | ||
9 | |||
在使用 filetype:pdf/doc 时也许更应当避免使用百度,因为结果多指向了百度文库... | |||
![这都是什么鬼❓❓❓] | |||
(https://course.chongbuluo.com/.gitbook/assets/image%20%28140%29.png) | |||
![露出了满意的微笑 <] | |||
(https://course.chongbuluo.com/.gitbook/assets/image%20%28189%29.png) |
这是一个可以节省你查找电影资源的 Chrome 插件
当我们在本地阅读文档的时候,经常需要使用搜索引擎查询某些文字。一般的操作流程是比
较麻烦的。而使用 Quicker 则可以非常快速地完成这个操作:选中文字后按鼠标中间键弹
出快捷面板,然后点击对应的操作按钮即可。
不仅仅可以搜索网页,Quicker 也可以结合 Everything 软件快速找到 Windows 中的文
件。
想象一下:您的同事在 IM 软件中提出需要您发送一个文档给他。如果你没有安装
Everything,您可能需要 (1)打开资源管理器 (2)一层一层目录找到文件 (3)拖放给
对方。如果安装了 Everything,您可以您需要(1)复制要搜索的文件名 (2)打开
Everything 软件搜索 (3)拖拽文件到 IM 中。如果使用 Quicker + Everything 则可以非
常快速的完成这个操作,请看下面的演示动画:
https://files.getquicker.net/_sitefiles/media/Quicker_Intro.mp4 (时长约 7 分钟)
支持平台:Windows;Android 下载地址:https://getquicker.net
早前虫部落社区曾有[方便群众给新生婴儿取名,公安自建同名同姓人员查询] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=3163)讲到重名查 询,目前现状依旧,即要前往各地公安平台查询重名信息。 那么你会如何来搜集这些零七八碎散落在各个政府公安网络平台的重名查询入口呢?
是丢到群里问「大佬」们?还是在搜索引擎中,用类似 地名 + 重名查询
的 Query 去挨个
搜索呢?两者选其一,当然是推荐后者。而在后者的实际操作中,又会出现因为方法选择而
导致效率高低之分。
如前所述,此类信息在一些野鸡网站也有发布或提供查询服务,但通过实际对比发现其数据
与官方确有出入。所以,我们只选择公安网络平台的查询入口。而这些网站的域名又具有共
同的特征:gov.cn。
所以,自然想到一个 Query:重名 site:gov.cn
,如果把这次搜索请求比作捕捞鱼虾,那
么重名
可看做是诱饵,site:gov.cn
就像渔网,诱饵和渔网组合,即可实现捕捞效率的更
大化。
搜索演示结果:
- [重名 site:gov.cn - Google Search](https://www.google.com/search?q=%E9%87%8D%E5%90%8D+site:gov.cn &newwindow=1&ei=dEtmXYTuNq_p_QastpzwBg&start=10&sa=N&ved=0ahUKEwi E-IGnoqXkAhWvdN8KHSwbB24Q8tMDCJYB&biw=1309&bih=677)
- [重名 site:gov.cn - 百度一下]
(https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&ch=&tn=baidu&b
ar=&wd=%E9%87%8D%E5%90%8D+site%3Agov.cn&rn=&oq=&rsv_pq=cac7ee9f0
001d793&rsv_t=ea49n%2BZcrqJnD1VL6pDBorlq8krpJr4W45g72PU8upDtZ9asRQz2j
A0SgEQ&rqlang=cn&rsv_enter=1&rsv_dl=ib&inputT=645)
这里用到高级搜索指令
site:
还可以换成 inurl:。即便你想按照自己事先梳理好的省市表格 来逐个搜索,那么以上方法也足够可靠,只需在重名
前加上地名即可,比如:四川 重名 site:gov.cn
搜索演示结果: - [四川 重名 site:gov.cn - Google Search](https://www.google.com/search?newwindow=1&hl=en&source=hp&ei=gk FnXZS2IKe5ggem8Lr4Aw&q=%E5%9B%9B%E5%B7%9D+%E9%87%8D%E5%90%8 D+site%3Agov.cn&oq=%E5%9B%9B%E5%B7%9D+%E9%87%8D%E5%90%8D+site %3Agov.cn&gs_l=psy-ab.3...307.2974..3400...1.0..0.727.1348.5-1j1......0....2j1..gws-wiz .IhnDjlXLsDU&ved=0ahUKEwiU_-f6jKfkAhWnnOAKHSa4Dj8Q4dUDCAU&uact=5)
- [四川 重名 site:gov.cn - 百度一下] (https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&ch=&tn=baidu&b ar=&wd=%E5%9B%9B%E5%B7%9D+%E9%87%8D%E5%90%8D+site%3Agov.cn&r n=&oq=&rsv_pq=84deeb5f0005f936&rsv_t=0f79b%2By6yySKLNT3cp1DrGmHAU4 6Du0NE%2BZjx5J%2BAekbGDyrGzjHbcwjmFY&rqlang=cn&rsv_enter=1&rsv_dl=ib &inputT=461)
遇到问题,不急于甩给别人来寻求帮助,而是独立思考,思考是否可以运用自己已知的知识 来解决问题。这即是最好的将「死的知识」融会贯通的过程。久而久之,当独立思考成为一 种习惯,必将会帮助我们发掘更多的潜力。
如果搜索之于你只是一个冰冷的工具,抑或是一些个人积累的技能和经验。我想它还不够丰 满。 每天都有无数次的网络搜索请求遍布世界各地,而寻找的故事也每天在生活中上演。它们中 总有许多有温度、有深度的情节,了解和讲述它们也应当成为所谓信息素养的一部分。 本章子节点将持续更新一些使其能够成为各位酒足饭饱之余的谈资的内容。如果你也有休闲 且不失内涵的搜索谈资,也欢迎在社区分享。
前不久,虫部落在社区发起了第一期会员活动周:虫部落会员活动周 ♕ 送 10 件定制 T-Shirts。 虽然这样的活动门槛较高(不难,但花时间),参与者不多,但我还是看到一个有关回忆里 的搜寻故事 —— [追寻我那个已经消失的小学] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=6348)。
又搜索了下,2004 年崇兴寺重修 —— 崇兴寺,俗称药王庙。崇兴寺被毁于 1953 年, 改做药王小学。镇里为了弘扬地域文化,振兴古镇经济,重修崇兴寺作为旅游开发项目。
没任何地方提到我的小学,它不存在了,好像从来就没存在过,除了我的梦里! 就像 @老唐 所 描述的这样,总有太多陪伴过我们的事物,被时间冲刷掉。网络上,现实中,甚至你的记忆 里,消失或模糊。我们说不上哪一种介质的存放效果更好,就像搜索的结果,如果第一页没 有找到满意的答案,那么余下的就全都是遗憾。
如果自己在网上到处留过个人信息,即使自己主动删除了,也可能会留有网页快照。 如何删除?投诉就行,一般三天之内就能删除。理由写泄露个人隐私。这里列出各大搜索引 擎申请删除快照的入口。
搜索引擎 | 申请地址 |
---|---|
https://support.google.com/websearch/troubleshooter/3111061?hl=zh-Hans | |
百度 | https://help.baidu.com/webmaster/add |
Bing | https://www.bing.com/webmaster/tools/eu-privacy-request |
搜狗 | http://fankui.help.sogou.com/index.php/web/web/index?type=2 |
360 | http://info.so.com/cache_remove.html |
Google 对于删除请求还做了划分。对于出现在搜索结果中的个人敏感信息,Google 提供 | |
了两种移除的方式: |
- 请求从 Google 搜索结果中移除个人信息,请访问从 Google 的搜索结果中移除相关信 息页 面。
- 如果你是出于法律原因希望移除某些信息,请访问[依法移除内容] (https://support.google.com/legal/troubleshooter/1114905?rd=1#ts=1115655)页 面。
在看过各种有关隐私保护的话题讨论之后,我产生了一个叛逆的想法:为什么要如此费心费 力地保护隐私?或者更准确地说:手机号、姓名、甚至 QQ、微信,这些个人信息真的需要 那么敏感地重视吗? 我常如此调侃:人家身价千万的大 V ,个个都有名有姓,并且作为公众人物,还常常受到 额外的关注。我一个普通百姓,如果连名字都不敢告诉群里的人,或者作为自己在网上发布 的作品的署名,是不是有点入戏太深了? 我们买房、买车,生活中有无数中交易行为都已经将手机号等信息出卖了,我们还有必要用 键盘去守护自己的姓名甚至网名? 我觉得太累了! 所以,对于隐私保护,我的终极方式是:与网络喷子、键盘侠以及一切可能会触发你做出愚 蠢事情的物种划清界限即可。
这是虫部落用户在邮件中安利给我的一部电影。为此我还在虫部落微信公众号策划了一期送 票活动:你哭穷,我送电影票 。 ![正式海报 · 台湾] (https://course.chongbuluo.com/.gitbook/assets/image%20%28112%29.png) 男主是一位工程师,他一直引以为傲的 16 岁乖女玛戈特突然失踪。前来调查此案的警探怀 疑女儿离家出走。不满这一结论的父亲为了寻找真相,独自展开调查。他打开了女儿的笔记 本电脑,用社交软件开始寻找破案线索。大卫必须在女儿消失之前,沿着她在虚拟世界 的足迹找到她......
地址 | 备注 |
---|---|
[腾讯视频] | |
(https://www.douban.com/link2/?url=http%3A%2F%2Fv.qq.com%2Fx%2Fcover%2Fl | |
nae2ndq7vejzhm.html%3Fptag%3Ddouban.movie&subtype=1&type=online-video) | |
单片付费 | |
疏通计划希望通过一个搜索聚合页面解决某一方向或类别的搜索需求的绝大部分。区别于早 期的虫部落快搜,疏通计划所做的工作更加细致。比如在后台统计使用频次和各个搜索引擎 的具体请求,在搜索界面用以实现搜索工具的优胜劣汰;更友好的界面设计,包括 UI 和搜 索 Tips。 整个操作不用登陆账户,仅保存于你的客户端 cookie 中,不涉及用户隐私问题。
高频搜索需求方向 | 完成度 |
---|---|
电子书 | ✅ |
图片素材类 | 50% |
学术搜索 | 50% |
数据报告 | 00% |
关注高频搜索需求。抛开特殊的专业人群,在一般人的平常学习、工作中,高频的搜索方向 才是我们需要重点关注的,此之谓「把有限的时间投入到无限的高频问题中去」。这样才能 使得学习、工作的效率不断提高,让搜索更简单即是让生活更简单。 chongbuluo.com � make search easier.
首先我们必须承认通过网络搜索获取到版权图书的电子资源是侵害著作者权益的盗版行为。 我们永远提倡购买正版,知识付费即是给予著作者创作土壤的肥料。 再者,我还要提醒各位留意自己在找电子书过程中的时间沉没成本。有的人为了十来块钱就 可以得到的东西而大费周折,这显然是不聪明的做法。我倾向于认为:你在搜索一样付费 资源上花费的时间越长,那么你自身的时间价值就越低,随之也说明它之于你的利用价值也 很低*(当然,如果你将其视为练习和提升自己的搜索能力就另当别论吧)*。 不过如同开源软件世界一样,数字化的图书世界也是有浩如烟海的可开放获取的资源。而接 下来所讲的搜索电子书的方法也部分适用于它们。 开放获取(英语:Open Access,简称 OA),是指不限制经过同行评审的学术研究的 在线访问。开放获取主要针对学术期刊文章,但也在提供越来越多的论文、书籍和学术专 著。
长篇大论的就免了,看这里:电子书搜索(再也不 用看臭又长的找书总结帖了)  默认排序即是依照一般的搜书的普遍性 + 成功率。当然后台还会根据用户对各个搜索引擎 的使用频率统计来定期更新,包括排序、撤销和上新。后续还会对所有搜索工具进行移动端 适配。
最近在某交流群看到有人推荐古典的新书《跃迁》,并发了该书的 azw3 格式文件。可是 这本书 8.1 才出版,请问各位大大有没有搜寻新出版的电子书的方法呢?真心请教,希望各 位大大指点!
——@[似梦若无常] (https://www.chongbuluo.com/home.php?mod=space&uid=4606) (2017.8.28) 这是虫友 @似梦若无常 在虫部落社区发的一个求助 帖:[请问最新出版的电子书该如何搜寻呢] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=2924)。 虫友 @蛇杖 在 跟帖中分享了他的观点,并且在最后总结回答了问题: 最后简单回答下楼主问题:
- 像你那样的资源交流群。
- 百度知道高悬赏,这个从某种程度上真的有用。
- 换格式搜索,epub 这个比较流行。
- 微信搜索,这个一搜全是(无利不起早,大多数有转发等要求) 。
- 特定论坛,太多了,自己选个合适的吧。
- 网易和腾讯都有读书软件,每周上新书,两个软件按规则基本都可以做到免费看书,有 没有要的新书就看运气了。 包括最新出版的图书电子资源在内,一些网络投机分子往往利用一些热门的付费资源来进行 买卖。这其中不乏空手套白狼者,轻则通过刷网站 SEO 来骗取流量;黑心的呢,当然是会 骗点钱财。各位请注意鉴别。
这是虫友 @坏脾气先森 i 提出的一个需 求,显然是情商还不够高的表现(为什么?看下文),但好在具有开阔搜索思路的效用。
一个女生在朋友圈发了个截图,说想看这本书,只有纸质版,而且断货;觉得不可能只有 纸质版,当当网断货了别的地方应该不会断(就是觉得那女生没有好好检索);自己想看看 自己能不能找见。
书名:《Women Food and God:An Unexpected Path To Almost Everything 》。
其实用电子书搜索很快可以找到这本书是有售的,孔 夫子旧书网 10 元一本简直不要太划算。如果需求比较强烈,买就是了。没必要钻牛角尖非 要找到你也不确定有没有的电子版。 在此类英文关键词搜索过程中还值得注意的是,如同下载盗版软件和影视资源一样,国外很 多网站用的是一个套路:设置关键词 SEO(比如在 title 中自动补全关键词 free、 download 等),先蒙骗搜索引擎,接下来诱导用户注册巴拉巴拉的,反正就是被套路一 番,最终到底有没有货还是另说。
下面摘选虫友 @ Pa9io 的一个搜 索过程,供各位参考。 首先,根据你的问题,我查找后发现基本只有类似于亚马逊书店才有,联想到用 kiddle 阅 读,然后逛了几个 kiddle 的论坛,一无所获,最后在 open library 上发现可以外借,故扫描版是在 open lib 上借的书,只有 13 天可以阅读,但是下载下来后我给破解了。 电子书版原本是一个 epub 格式的,我转换过来的。一般这种亚马逊书籍都是 epub、 mobi 格式的,所以直接搜 pdf 很难出结果。 最后,找这本书还是花了一点时间,每个网页都进去看了,只有两家店提供免费下载,其他 的都需要注册。 Open Library 是互联网档案馆的一个项目,是一个非盈利组织。它提供对许多公共领 域和绝版书籍的在线访问。
如何在网络搜索中分辨信息的真假是一个永恒的话题。说永恒,是因为刻意造假行为的层出
不穷,是因为信息传播过程中总会存在「掉真」的事实。那么在搜索的过程中,我们该如何
更接近事物的真实本质呢?
就像下面这张 PS 痕迹相当明显的截图,发到群里娱乐下,然后居然也有人发上自己搜索「
虫子漂亮不」的截图问:为什么我我这不是呢 =
- 能用 Google 就不用百度,从源头远离李鬼
- 对于不熟悉的领域,利用
官网
等关键词组合查询 - 找对了权威平台,接下来还要结合自己的需求注意信息的时效性
![虫部落群聊截图] (https://course.chongbuluo.com/.gitbook/assets/image%20%2882%29.png) 请找出这句话的英文原版(假定原版是英文吧)。
无论是别人的提问还是自己的疑问,首先要遵守一个基本点:先问是不是,再问为什么。说 到截图的提问即是:
- 这句话确定是卡夫卡说的?(基于目前中文网络环境流行的讹传,特别是名人名言)
- 原版确定是英文?(因为重点应该强调的是原版,而卡夫卡著述的语言不一定为英文)
这个过程重点强调思路。首先,按照提问者的意思。直接搜这句话,或者再组合诸如出处、
英文版、卡夫卡等等相关的关键词搜索,都不会得到结果。基本都是摘录了这句话作为名人
名言贴在文章里之类的。
其中在 【村上春树经典语录】最完整村上春树经典语录大全( 8 已失效) 这个网
页中,出现了这么一节:
我永远得不到足够的热量,所以我燃烧 —— 因冷而烧成灰烬。——《海边的卡夫卡》 满以为很接近结果了。然而...... 搜 海边的卡夫卡 可知这是日本著名作家村上春树的作品。 然后继续搜 海边的卡夫卡的 txt 电子书版本后, Ctrl+F 检索这句话 —— 没有! img之后我又找 到日文版本[《海边的卡夫卡》在线 PDF 版] (https://www.lang.nagoya-u.ac.jp/proj/sosho/6/nishikawa.pdf) 检索相关翻译词汇,无 果而终(当然我知道这其中肯定涉及到意译,所以我试了多个这句话中的分词的日文版,还 包括英文版。总之无果。 只好转变方向咯~ 然后又在这句话的搜索结果中看到一个豆瓣的结果页面卡夫卡如是说 ——《卡夫卡谈话 录》阅读笔记,其中出现了: 4、我永远得不到足够的热量,所以我燃烧 —— 因冷而烧成灰烬。 很显然从内容来看,这个比刚才那个靠谱多了有木有?(上面那个坑爹的经典语录类网站, 或者此类文章,经常会赶出张冠李戴的事情,很不负责! img) 这下好了,接下来重点转移到 《卡夫卡谈话录》这本书了。搜索相关词,得出信息点:
- 这本书中文版再版过三次(《卡夫卡对我说》、《卡夫卡口述》、《卡夫卡谈话录》), 三家出版社;
- 同一个人(赵登荣 )翻译;
- 原著作者是卡夫卡(奥匈帝国)口述、他的弟子古斯塔夫・雅诺施(捷克)记录
- 原著是德文,所以那位虫友的问题应该修正为德文原话是什么(当然这本书也有英文版) 好,下面的思路即是:
- 找出中文电子版,找到这句话所属的章节段落;
- 找到德文电子版,然后在对应的段落找出原话;
为什么?不用翻译直接到德文著作中检索呢?因为意译和翻译不给力的原因,这个途径行不
通(最开始也是这么尝试的)
找到中文《卡夫卡谈话录》 PDF 版,尼玛居然是影印版,还要转成 Word 才能检索(优先
找 txt 版,没找到)。
《卡夫卡谈话录》德文版,说实话还不太好找,首先先得知道德文原著的书名,并不是把中
文翻译成德文这么简单,也不是搜索 卡夫卡谈话录 + 原著名等组合词就能得到结果,反正
我是通过翻译他弟子古斯塔夫・雅诺施的德语名,通过 Google 翻译 ——>Gustav Jarno
Shi(很显然这个翻译也是是带着机器的味道),然后,为了准确起见。我大概查了下德国
用的较多包括雅虎德国,所以就在里面检索 Kafka
Gustav Jarno Shi 得到第条结果显示:
这个 Gespräche mit Kafka 用 Google 翻译过来就是 卡夫卡对话,结合文章信息看来这本 书原著名就叫《Gespräche mit Kafka》 然后继续通过 Yahoo! 德国搜索找到这本书的[德文原著 PDF 版下载地址] (http://www.baby-woods.com/download.php?new=8352b0f6310437e18f9079932e 020260&title=Gespr%C3%A4che%20mit%20Kafka&Filesize=424kb&Author1=Kafk a,%20Franz&Author2=%20&Author3=%20&Author4=&Extension=pdf) (还好不是 影印版)
- [求出处:相逢的人会再相逢 这句话是出自村上春树的著作吗] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=4404)
这是我在 [虫部落邀请码第 17 期题目:用搜索引擎来弥补遗憾]
(https://www.chongbuluo.com/thread-6016-1-1.html) 中设计的第 2 个搜索问题。
照片中的这个妹子是... 虫子的前前前... 前女友!
img某年某月某
日一起去看一场球赛时所拍。奈何拍照技术太渣... 后来为了把「时任女友」放到照片中的黄
金分割点,我就把照片裁剪成了上图的样子。但是记得曾经还把原图发到网上被媒体拿去报
道... 有媒体评价她是「大波長腿」,嗯... 我觉比较中肯!再后来,因为前任实在太多,阅历
实在饱和,导致我突然今天看到这张照片时... 愣是想不起这场比分上狂虐不丹的比赛是在哪
座球场看的了。你知道我是一个很念旧的人,请帮我找找... 这座球场的名字叫什么?
我收到的参与解答的邮件中,有相当一部分人轻易相信了百度知道的那个问题下的留言,给
出了第二问答案是:长沙贺龙体育场。
网友百度搜索:中国足球5比0不丹是在那个球场
,第一条百度知道里面有人解答了。

对此,虫友 @我是果粒橙 在邮件的末尾批评道:
附:百度知道有人回答这道题是长沙那场,按虫话说就是没有契约精神而且还害人。很久 前混迹百度知道,希望能帮助人,途中因学业放弃。最近因为一些原因回去看发现自己回答 不多但帮助过的人也近百万,很开心,但知道也不是最开始的知道了。缘分来到部落,看到 很多人都很优秀,希望能继续发展自己,秉承本心的去帮助更多的人。(谢谢倾听)
在搜索过程中,百度知道有时候确实能够帮助我们解决一些很奇葩的问题。但其整体可信度 较低,真实性堪忧。 特别特别要提醒某些容易被幸福冲昏头脑的人,你如果在百度知道看到了与你问题描述高度 相似甚至相同的问题,千万克制自己不要产生「哇!原来答案就在这儿」的错觉。你这种幸 福的错觉是建立在问题的高度相似之上,而非对答案的确认。
虫部落微信订阅号的关注者 @smile 在留言中写下了她在搜索中比较的一类问题:
我以「搜索汉堡王品牌官网」为例,从网站域名和 Query 语言两个角度来帮助更好地解决
这类问题。
Google 搜索:汉堡王官网
,看第一条结果的域名链接,不但放弃 .com 直接上 .cn ,而
且还嫌不够接地气,再把原来的 burgerking 缩写成 bk ,让我堂堂 china 尾随其后 >?
再看上图搜索结果的第二条,倒是可以用一般的域名规律尝试下 —— 去掉 .tw 。然后会发
现跳转到 bk.com (真・官网)。
域名规律:国外组织或品牌针对中国地区的官网一般常用 .com.cn 的域名后缀。照此逆
推,一般去掉 .cn 后的域名即是它们的不分国别的官网。
而如果直接用 Google 搜索汉堡王的英文品牌名
burger king official website
或
burger king
呢?
- 尽量不用更懂中文的百度去搜索国际品牌的官网;
- 了解并且利用域名后缀的国别规律适时进行尝试;
- 网络中的去伪存真本身就在提示我们要货比三家。
时效性是指信息仅在一定时间段内对决策具有价值的属性。放置于搜索中,即是要培养用时 间区间来优化 Query 的意识,以及在参考和引用搜索结果时再次确认「有效」的习惯。 ![Google 新闻搜索工具中的时间筛选项] (https://course.chongbuluo.com/.gitbook/assets/image%20%28154%29.png)
事件 | 时效性描述 |
---|---|
打赌 | 你比别人早知道某个信息,利用时效性导致的信息不对称「割韭菜」。 |
表白 | 错过了最佳时间「窗口」,可能就成了愚蠢或矫情。 |
租房 | 关注房源的发布时间,可以过滤掉一部分不真实信息。 |
Debug | 由于程序的迭代,参考早期版本的问题解决方案是不明智甚至危险的做法。 |
...... | ...... |
在搜索过程中如何获取具有时效性的信息(换言之,即如何过滤掉失去时效性的信息)是本 教程所讲的「搜索信息三要素」中的重要一环。 而科学应对这一问题的方法其实很简单,即时刻关注你正在搜索的对象发生有效作用的时 间区间(这句话虽然看起来有点儿抽象,但结合上文列举的「场景」则会很容易理解)。 这应当成为一种下意识的习惯,而非像表面看起来那样需要高度的神经聚焦。后面我也将在 案例中提供这一视角的解读。
刻舟求剑是我印象比较深刻的小学语文课本中的一则典故。剑落水中,船行不止,描述的即
是事物的客观发展变化。楚人无视时空位移,自然误入刻舟求剑的歧途。
我们在网络中进行搜索时,也会遇到这种需要留意事物发展变化的客观事实,即信息的时效
性。
就拿下面这张虫子几个月前拍到的照片为例。不出意外照片中的房产中介、便利店和餐馆都
会被链接到互联网中。房产中介可能会发布一些信息到 58 同城,「秦之所为」的肉夹馍可
能被某个吃货在微博上安利了一波,全时便利店最近可能在网上发布了招聘店员的信息...
这些信息都具有各方面的时效性,比如中介昨天中午刚发的房子下午就成交了,那么有房可
租这个信息便失效了;便利店上周才发完招聘,第二天就有几个路过的大妈看到贴在门口的
招聘... 应聘成功了;至于这个陕西餐馆,现在到底还开张着没 —— 因为虫子曾预言它不出
半年自会倒闭
所以,为了让今天的问题更丰满一点,就假设虫子下周要去老乡开的这家「秦之所为」大快
朵颐(其实很不好吃 ==!)。
综上,请问:请问照片中的这家「秦之所为」是否已倒闭?如果是,那么现在的新店铺名
叫什么?
备注:题目发布时间为 2018.5.3
用发展的眼光的看待世界,不是一句停留在概念层面的空话。事实上,用它来指导我们的思 维和行为,总是有着理性而客观的价值! 互联网网络万物,虚拟的,现实的。而即便钻石恒久远,它的空间位置、归属也会发生变 化。而对于网络信息,我们在必要时,更要对其时效性保持警惕。 在本案例中,我们搜索的对象(秦之所为餐馆)发生有效作用(正常营业)的时 间区间即为实时的。
假装看房,找到旁边房产中介的工作人员的联系方式(这个理论很容易的,他们求之不 得),加起微信,顺便问下:哎,你们旁边原来叫秦之所为的那个店现在改换门庭了吗?叫 啥嘞,麻烦帮我看哈,搞定~
——@布拉格
说个自己的经历,之前吃过一家很好喝的藕汤,然后过了一段时间又想去喝了,打开美团 看了下显示还在营业,就过去了,到了发现店已经不在了
——@Abner
经过我的精密分析老板拿着纸板。打量着要怎么转让了,还有可以看门口店的凳子应该要 搬走了
——@nam yoon soo_
\1. 高德地图,搜索 “满城房产(会展中心店)”,得到地址:成都市武侯区高新区天华 路英郡 6 栋 1 层 4 号。打开此店图片详情,发现旁边正是虫子所提到的全时便利店,证明 查找无误 2. 由虫子提供的高清图,可以看到秦之所为的门牌号为 517 号,但是道路看不 清,结合第一步地址结果,可知是天华路 517 号 3. 高德地图,搜索 “天华路 517 号”, 结果为轻岚茶语。 由上分析,秦之所为已被轻岚茶语取缔。不知对否?
——@登科
百度地图搜索秦之所为共有三家店,在会展中心的是天华路 515 号。百度地址加秦之所 为到大众点评,评论最近为 17.8 图片吻合,疑似已死。并有商家电话 1867235**** 太晚 了不想骚扰。。。 所以我猜宜宾燃面,因为我在大连想吃燃面。。。
——@Meteor
之前的一条回答是错误的,大家也看到了。那我重新分享下思路好了。根据虫大提供的图 片,可以看到这是位于会展中心的一家名为秦之所为的肉夹馍店。 1. 将其名称输入到各大 外卖 app 内,进一步确定准确地理方位和信息 2. 根据其外卖信息和评价初步确定这家店运 作的时间和店主联系方式。 3. 进一步判断可根据本地论坛和 58 等交易场所等招聘和近期 是否有物品出售等信息判断。 4. 根据四川省国家企业信用信息公示系统确定,这家店已经 不在了。
——@于无声处听惊雷
下图(2019.6.18 制)是关键词「华为」近 90 天分别在微博指数、百度指数和微信指数的
变化。请问是什么事件导致在 4.11~4.12 日,「华为」的搜索指数陡增?
信息特别是新闻信息具有极强的时效性,这种时效性反映在搜索中即可以用搜索指数来分 析。搜索引擎针对信息的时效性特点,都在高级搜索工具中提供了按时间筛选的功能。 ![微博高级搜索选项菜单] (https://course.chongbuluo.com/.gitbook/assets/image%20%28202%29.png) 更进一步,针对舆情信息的统计分析,还提供了指数搜索。高级搜索可以通过限定时间来帮 助分析搜索指数的变化。
通过搜狗微信搜索 华为
,然后将时间限定在 2019-04-11~2019-04-12
。浏览下文章标
题可推知是因为号称可以拍月亮的华为 P30 Pro 发布。
![搜索结果部分截图]
(https://course.chongbuluo.com/.gitbook/assets/image%20%2843%29.png)
所以在本案例中,我们搜索的对象(华为)发生有效作用(搜索指数陡增)的时
间区间即为 4.11~4.12 。
搜狗微信搜索;[百度指数]
(https://index.baidu.com/);微博指数和微信指数入口都在手机 App 中,搜索对应关键词
即可使用。
虽然真实性和权威性存在着交集,但相较于验证「真实性」过程的各种不确定性而言,权威
性则有着明晰的规范准则。
权威不完全代表真理和真实,它代表了人们对于信息真实性和时效性的更高诉求,即希望有
人或组织来为信息做背书。
在「信息的真实性」中提到的三点同样适用,并得以再次强调。
- 能用 Google 就不用百度,从源头远离李鬼
- 对于不熟悉的领域,利用
官网
等关键词组合查询 - 找对了权威平台,接下来还要结合自己的需求注意信息的时效性
萌妹:虫子哥哥,春节假期陪我一起去@A 玩儿呀 <
虫子:不行唉!家长已经安排好回去相亲呢...
萌妹:鄙视你!!!
虫子:咋?
萌妹:有照片吗?让我看看!
虫子:喏 ——
萌妹:错!全部 Pass!!!
虫子:怎么?难道你有更好的推介 B
萌妹:那是!知道你是个好色虫,那我带你去CD 吧,美女如云。
虫子: 匈牙利?为什么不直接去跟它挨着的乌克兰呢,那里才是美女如云海呢...
萌妹:错!匈牙利的国旗是从上到下的红 — 白 — 绿!
虫子:你还懂得多也...
萌妹:错!我其实也是刚搜了下才晓得 E
虫子: : 能不能别总是错错错... 那你开始说的那白蓝旗旗的地方不去了?
萌妹:都去!
虫子:很近?
萌妹:对!CD {@A }
虫子: F
萌妹:就是 A 包围了 B,厉害吧 �
虫子:这么叼 �
萌妹:岂止!CD 包围了两个国家哩~
虫子:...... 有点儿意思
萌妹:而且这三个国家的可玩儿性都很高呢,名胜古迹、自然风光数不胜数...
虫子:你有去过的吗?
萌妹:没!不过昨天看到闺蜜去拍的照片,感觉好美!给你看 ——
虫子:原来是马赛克呀。老早就逛遍全城了... 不过是在 Google 街景里
萌妹: G
虫子:说起来这地儿还是世界遗产,我记得整个 CD有老多世界遗产了
萌妹:多多?
虫子:那你给查查,这三个国家一共有______处世界遗产,也涨涨姿势 B
信息的权威性:在这道题目的作答留言中出现了挺多不同的数字,有相当一部分是因为
信源的错误。对于具有时效性的信息,应当追根溯源,去到权威的发布平台查证。这样就可
以避免网络中各种过时的的垃圾信息。
而这道题目涉及的问题,显然由「有没有世界遗产名录的权威发布平台?」这个思路下去就
会很快找到答案。
另外再补充一个这道题目想传递的信息点:Google 对 emoji 表情的索引是最友好的。
清一色地索引自 Emojipedia。如果你在社交中看到不认识的国旗 emoji ,Google 之。
这里引用并补充一位虫友的解答作为参考:
答案:56
过程:说到包围的时候,我就知道这三个国家是意大利、梵蒂冈、圣马力诺了,以前 学地理的时候国中之国还是印象深刻的,意大利有 54 处世界遗产,这个是最好查的,目前 位于遗产名录榜首(中国有 52 处)。梵蒂冈有 2 处,梵蒂冈就 0.2 平方公里左右,还没中 国一个小村子大,梵蒂冈城整个就算一处世界遗产,还有一处是和意大利共管的,是在意大 利境内。圣马力诺比梵蒂冈大一些,也有一处世界遗产。54+2+1-1=56。 注意:问的是世 界遗产,不是单独的世界自然遗产或者世界文化遗产。
网站:https://whc.unesco.org/zh/list/ 备注:计算式中减去 1 是因为意大利和梵蒂冈共有一处世界遗产。
题目中涉及到的圣马力诺和梵蒂冈,皆为国中国。这样的国家在地球上一共也只有 5 个, 当然... 它们面积都很小。 初中地理告诉我们,梵蒂冈是世界上最小的国家。不过,说它却是影响世界人口最多的国 家,我倒是头一次听说。因为天主教会在全球信仰人口众多,现有十多亿天主教教徒,使其 在政治和文化等领域对世界拥有重大的影响力。而梵蒂冈即是天主教会最高权力机构圣座的 所在地、天主教会最高领袖教宗的驻地、世界六分之一人口的信仰中心! ![梵蒂冈圣彼得广场] (https://course.chongbuluo.com/.gitbook/assets/image%20%2888%29.png)
下图早前一位身居国外的虫友给我发的支持虫部落公益活动的捐赠记录截屏。
请问:这位虫友目前所在国家的男足和女足在世界的排名分别是多少?
根据常识可以判断这个问题的突破点在于截屏左上角的电信运营商名称 netzclub+。
Google 搜索关键词 netzclub+ 即可获知国家;而问及到男女足的世界排名,熟悉足球的
人知道应从国际足联(FIFA)的官方获取权威的最新排名信息,而不关注足球的也可通过
Google 搜索英文关键词 football world rank
或中文关键词 国际足球排名
,粗略分析
搜索结果,不难知道获取这一信息的官方平台。
使用中文搜索足球相关的关键词,需要注意排名靠前的结果很多都是博彩公司的恶意 SEO
结果。
Google **** 搜索关键词 netzclub+ 国家
可得知运营商所在国家:德国。
接下来就是寻找获取国际足球排名的权威发布平台,通过上述搜索要点,可以获知是 FIFA
。
进入 FIFA 官网,在 WORD RANKING
导航栏中即可获得完整的排名信息。
男足世界排名:https://www.fifa.com/fifa-world-ranking/ranking-table/men/
女足世界排名:https://www.fifa.com/fifa-world-ranking/ranking-table/women/
去年 3 月底的一天晚上在处理邮件,发现垃圾箱里还有好几封,都是因为奇怪的后缀被过
滤到垃圾箱了。其中...
看到这个邮箱后缀 Illinois.edu ,我只晓得 edu 是美国大学的教育类邮箱,其它国家的则
是继续在 edu 后面续上国别顶级域名,比如中国就是 edu.cn
那... 这个 Illinois 呢?搜索得知是伊利诺伊大学 ——
而这所大学与中国也是颇有渊源。
伊利诺伊大学与中国有着特殊的关系,早在 1906 年,时任校长爱德蒙・詹姆斯致信美国 总统西奥多・罗斯福建议将庚子赔款用于发展中国的教育事业,后来发展为庚子赔款奖学 金,诸多的中国学生得以留美深造。而在 1911-1920 年,伊利诺大学收留和培养了多达 1/3 的留美中国学生,是对中国学生最友好的大学之一。
—— 维基百科 请问:伊利诺伊大学目前注册在读的中国留学生总数是多少?
这个问题的指向很明确了,伊利诺伊大学。「问渠那得清如许,为有源头活水来」,关于学 校在读中国留学生的注册人数,学校自然是有数据。或者再发散一步,教育部应该也是有 的。而至于其它媒体、博客、�社交平台转载的数据,都有可能存在信息失真的情况,又或 者是已经失去了时效性。
这里引用两位虫友的作答作为具体的过程参考。
Google 搜索 “how many chinese students in University of Illinois”,第一条结果 命中该校官网给出的 Statistics,点进去 http://isss.illinois.edu/about/statistics.html 下载 2017Fall 的最新数据,报告第 16 页给出来自中国(内地)的学生总数为 5845。在报 告的第 16、17 页中 Hong Kong 学生数量为 38,澳门学生数量为 5,台湾学生数量为 323。把这几项加起来的中国学生总数为 6211。
——@张贺
前面计算的张贺很厉害,我作为 2017fall 的一员,提醒一下,主要是现在新学期已经入 学了,所以应该是相关数字减去 2017 毕业人数加上 2018 年春录取的人数。刚关注部落的 我表示十分怀念在 uiuc 的时光,其实除了 uiuc,伊利诺伊大学还包括了春田分校和芝加哥 分校,之前有华人副校长,后来因为各种原因辞职了。去年是 150 周年校庆,去年章莹颖 作为访问学者在我每日途经的道路上失踪遇害,其实,若是没有这个意外,她将作为一名中 国留学生算在今天的总人数里。新任易行长也是校友,有机会的话,大家从芝加哥坐上火车 往南,三个半小时可以到达厄巴纳这座小城,看看图书馆,别有乐趣。
——@倪华
在大概了解完伊利诺伊大学的相关信息,准备关掉网页时... 不经意间瞥见在这所大学的知名 校友中三个熟悉的中文名:竺可桢、华罗庚、李安。 竺可桢:印象最深的是小学语文课本中讲到他如何刻苦,晚上宿舍关灯,他就去借着校园的 路灯看书。(后被纠正那位借灯读书的应是童第周) 华罗庚:虫子距离华罗庚最近的一次是在初一... 数学老师站在老远的讲台上将一盒粉笔 砸向我和同桌,因为我俩老是不听讲而在端着一本奥林匹克竞赛书研究,候老师厉声骂道: “你俩都以为自己会是华罗庚吗?如果每次都能考 100 分的话以后就可以不用听我讲!” 李安:印象最深的是杨澜对他的一次采访,他讲自己在家好吃懒做,无所事事了三年, 他老婆从没有抱怨他... 他后来拍了那么多电影,最想献给的人就是自己的老婆那段颓废时光 的不离不弃。
在《World Happiness Report 2018》中,它被排为世界上最幸福的国家 ——Finland -
芬兰。极光、桑拿、诺基亚、Linux、圣诞人,这些是我对于印象标签。
世界幸福报告(英语:World Happiness Report)是联合国为衡量快乐之可持续发展方 案,于网络上出版的国际调查报告。该报告由英属哥伦比亚大学、加拿大高等研究院教授约 翰・F・哈利维尔(John F. Helliwell);开创 “快乐经济学” 为名的理查・莱亚德;哥伦 比亚大学地球研究所所长及教授、前联合国秘书长潘基文的特别顾问杰佛瑞・萨克斯等人所 编。
—— 维基百科 2012 年 4 月 1 日,第一份世界幸福报告正式发行,成为世界首份以幸福为基础的国际调查 报告。而芬兰一直位列此报告中国家幸福排行榜的前十。 请问:芬兰在历年世界幸福报告中的国家幸福榜单中,排行最低的一次是第几位?
或许你通过分别 Google / 百度 世界幸福报告 2012/2013/2014... 也可以从零散的各类网 站获取到榜单信息。但是我想在这一章节重点强化的是从权威的发布源获取信息的思维习 惯。这一习惯不但保证了信息的真实性,同时也常常是效率较高的路径。那么回到本题, 你需要首先确认的即是世界幸福报告的权威发布源是什么?
Google 搜索 World Happiness Report
进入官网(https://worldhappiness.report/
)下载自 2012 年来的历年报告,里面有全部的榜单数据。对比下来芬兰最低排名是在第
七。
北欧五国长期霸占 World Happiness Report Top10 ,难道幸福与环境温度有关
2019 年 8 月 29 日,中国社会组织动态官微发布《民政部依法关停 14 家非法社会组织网 站》一文。在这次关停操作涉及 14 家非法社会组织中,既有中国农业科技创新发展工作委 员会、中国数字信息与安全产业联盟等等这样看起来很「官方」的组织,也有世界双节棍联 盟这样给人一脸黑人问号的野鸡组织。说到本质上,它们都是名字看起来很权威的非法组 织。
正是利用了人们对于权威的信任,各种非法的野鸡组织机构才层出不穷,利用信息不对称来
收缴一部分人的智商税。那么如何验证这些组织的权威性呢?
现在我们知道有中国社会组织公共服务平台
这样专门管理和监督社会组织的存在,并且可以在其官网或微信小程序查询已备案的组织信
息。而即便我们不了解,也是可以通过通用搜索引擎来尝试搜索。
比如,我们想验证某社会组织或者其它媒体转载其信息的权威性,就可以自然地联想到 社 会组织 查询
这样的 Query ,再尝试搜索:
- [社会组织 查询_百度搜索] (https://www.baidu.com/s?ie=utf-8&wd=%E7%A4%BE%E4%BC%9A%E7%BB%84% E7%BB%87+%E6%9F%A5%E8%AF%A2)
- [社会组织 查询 - Google Search](https://www.google.com/search?q=%E7%A4%BE%E4%BC%9A%E7%BB%84 %E7%BB%87+%E6%9F%A5%E8%AF%A2) 就很容易获知官方的查询入口,也就很容易识破世界双节棍联盟这样出来搞笑的名堂。 除此之外,我们还可以通过「被验证对象」的网络主页来分辨,特别是要关注页面底部的备 案信息、统一标识、联系方式等「身份信息」,并以此作为鉴定的重要参考。
\1. 请问网页版百度网页搜索(看起来有点绕)实际上最多能展示多少条结果?
760
不确定的数字
10000
释义
这是一个看起来没有啥用的测试问答,但通过实际的探究,你或许会另有启发。在完成一次
搜索请求后,注意观察页面链接中的参数;然后再点击搜索结果底部的翻页按钮(比如 7
),再观察此时页面链接的参数变化,你就可以发现这样的规律:
https://www.baidu.com/s?wd=111&pn=60
,其中 111
是关键词,60
是到当前页面
的结果总数(不包含当前页面结果数)。那么我们就可以通过改变 pn
的值,来快速测验
百度实际最多会呈现多少条结果。
上图是一首歌曲 MV 中的画面。此插画场景取材于某学校的真实场所,请问这所学校最初
的校徽上印刻的文字是什么?
P.S. 这首歌的作者就住在操场外面的马路对面 H
I
标签:
反向图片搜索
关键词描述
难度:★☆☆☆☆
日出想必大多数人读见过,但地出你见过吗?
这是人类第一次从月球的视角拍到的 Earthrise 景象 —— 美腻!
请问在拍到 Earthrise 多少天后人类首次登上了月球?
I 标签:
反向图片搜索
信息的权威性
难度:★☆☆☆☆
有一座城市 A 即是以上图钞票正面印刷的人物的名字命名。A 在中国的第一个的友好城市
是 B。
现在虫子发明了一种革命性的直线飞行的直达交通工具 —— 贝塔狗,极速、环保且廉价,
每公里只需花费人民币 4 分钱!
请问:图中的这张钞票能发否买到乘坐贝塔狗从 A 到 B 的一张返程票?(余票充足)
I
标签:
微博搜索
Google 地图
难度:★☆☆☆☆
请问:这支化妆品的生产日期是________。
I
标签:
垂直搜索
难度:★☆☆☆☆
**上图中的字体名为 A ,同时 A 也是欧洲某小国名,这个国家的面积排名全球倒数第几?
**
I
标签:
字体反向搜索
信息的权威性
难度:★☆☆☆☆
虫部落有很明确的定位:传统搜索和网络信息的认知、获取和整合领域。目标是通过扩展人 们对于搜索的认知,发现高效的信息获取路径以及培养良好的网络信息素养来不断践行虫部 落的 Slogan:让搜索更简单。 chongbuluo.com � make search easier. 在这门教程第一版的尾巴,我为各位精心摘选了虫部落社区沉淀下的部分内容,希望各位也 能不仅仅是作为一个内容的看客和传播者,而是大胆与别人交流、分享你的观点和创意,这 样的知识积累才具有活性,才能永葆生命力。
标题 | 内容标签 |
---|---|
[毕业季租房:如何搜索有效的个人房源信息] | |
(https://www.chongbuluo.com/forum.php?mod=viewthread&tid=5035) | 租房、房 |
源、信息的真实性 | |
[各位大神,通常在哪里下载专利啊] | |
(https://www.chongbuluo.com/forum.php?mod=viewthread&tid=5696) | 专利、免 |
费、下载 | |
[Peekier:一次被虫子翻牌的搜索经历] | |
(https://www.chongbuluo.com/forum.php?mod=viewthread&tid=2139) | 关键的关 |
键词、经历 | |
[凭着零碎的文件名记忆如何找到需要的文件] | |
(https://www.chongbuluo.com/forum.php?mod=viewthread&tid=5390) | 模糊记忆 |
| | [求助大佬,有哪些网站可以找到珍贵的史料文献] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=5375) | 史料、奇 技淫巧 | | [地产狗求助:如何获取土地信息和土地成交数据] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=5218) | | | [求助虫友们,CSDN 的下载方法] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=4921) | | | 这种扇形数据图表是用什么工具做得呢? | | | 为什么虫部落 2013 年已经上线,我却现在才知道? | | | [Get 搜索技能:探究化妆品保质期之谜] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=4567) | | | [如何查找识别照片上的异形(不认识的)文字] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=4540) | | | 怎样才是搜集整理考公资料的正确姿势? | | | 移动硬盘文件夹和重复文件太多有什么软件么? | |
标题 | 内容标签 |
---|---|
[由一次搜索案例浅谈搜索的逻辑性意义] | |
(https://www.chongbuluo.com/forum.php?mod=viewthread&tid=9) | |
[Vintage Ad Browser:搜索国外的老广告图片资源] | |
(https://www.chongbuluo.com/forum.php?mod=viewthread&tid=1481) | |
[少数民族自己的搜索引擎都有哪些? | |
](https://www.chongbuluo.com/forum.php?mod=viewthread&tid=872) | |
[穿暖花开,出门赏花如何识花? | |
](https://www.chongbuluo.com/forum.php?mod=viewthread&tid=1103) |
| | [What-Dog:狗狗识别器,巨硬出品] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=1036) | | | [Gallerix 牛逼的绘画,名作搜索网站] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=1569) | | | [超级强大的动漫 BT 搜索下载站] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=1194) | | | [使用二次元图站 Tag 系统进行搜索的简单应用] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=1205) | | | [鲁迅语录搜索引擎上线!我就看看谁在伪造迅哥名言] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=6210) | | | [收集 1500 多万数据,创建了这个多语言语料搜索引擎] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=6174) | | | 几个靠谱的国家标准搜索引擎 / 网站(可免费下载) | | | [shapecatcher:在线画图搜索特殊符号的神器] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=766) | | | [知网等学术文献免费下载解决办法] (https://www.chongbuluo.com/forum.php?mod=viewthread&tid=4844) | 免费、全 文获取 | | 一个体验不错的 Linux 命令搜索引擎 | Linux |
男。
有了,很漂亮(由内而外的那种)。意味着以后不会被各位吐槽忙着找对象「不务正业」 了,也祝尚未脱单的各位早日遇见自己灵魂伴侣!
不会。因为此前也尝试过,发现无论是讲述理论还是案例,对于学习者来说都存在诸多不 便。当然我知道视频是当下很多人喜闻乐见的知识获取媒介,但重点还是要看内容本身。务 实的学习过程必然是有亲自上手练习,而非看个视频,做个小笔记那么轻松。
有啊!比如已经在构想的每个月微信群干货分享,约定时间,拉付费用户入群,就一个搜索 话题展开交流(提前准备一些素材),最后一个环节抢答,答对赢取虫部落 T 恤一件,分 享结束后解散群。这其中的所有服务和奖品都是免费为各位提供。
当然!我与各位最紧密的联系就在微信(GifFox)。为了提高会话效率,请将你的问题一次 性完整描述清楚(不要挤牙膏),我一定会回复。只是时效性无法保证,因为我平时也很 忙。