有没有支持正则expression式search的search引擎?
首先,我检查了这个问题,但答案指的是过时的服务。
那么有没有一个基于networking的(或软件,我不在乎)提供正则expression式search互联网内容?
让我在这里写一个来自superuser.com 问题的答案,因为我完全支持作者:
来自Ask Metafilter的引用:
使关键字search有效超过数百TB(或者其他索引到目前为止)的唯一可能的方法是预先计算单词索引。
事实上,一个完整的正则expression式引擎是完整的,你可以编写任意的正则expression式,吞噬接近无限的CPU时间和内存。 由于所有这些原因,他们向公众提供正则expression式search将是技术上的疯狂。
正则expression式引擎没有即时search。 这可能是由于页面的索引方式。 允许一个人在网上查找会花费大量的计算能力。
dayyan是正确的,它是使search引擎快速的反向索引; 如果您只有100 TB的闪存磁盘,则无法加速超过1 TB内容的正则expression式search。 关键字search,反向索引,没问题。
blekko的web grep(https://blekko.com/ws/+/webgrep)支持正则expression式,但是我们得到的大部分search结果都是用于常量string的,通常是在HTML中,因为这很有趣:谁使用微格式?; 谁使用各种JavaScript库? 谁使用各种评论系统? 等等。
如果你给我们一个正则expression式,我们很乐意为你运行。
运行这些search包括一个MapReduce作业运行在我们的爬网中的所有html。 这就是为什么需要一段时间(一两天)才能得到答案。
虽然您不太可能find使用完整正则expression式search的网站,但Google确实有一定的匹配能力。 根据你想要达到的目标可能就够了。
GoogleGuide似乎有相当深入的一些可用选项。 也许如果你举一个你想要search的查询的例子,我们可以find一个解决scheme?
如果它需要是正则expression式,那么我认为你是搞砸了。 但是,如果您只是寻求更多searchfunction, 请http://www.googleguide.com/advanced_operators_reference.html