Tag: elasticsearch

用术语filter弹性search连字符问题

我有以下弹性search查询只有一个词条filter。 我的查询是复杂得多,但我只是试图在这里显示的问题。 { "filter": { "term": { "field": "update-time" } } } 当我将一个连字符值传递给filter时,我得到的结果为零。 但是,如果我尝试没有一个无价值的价值,我得到的结果回来。 我不确定连字符是否是一个问题,但是我的情况让我相信。 有没有办法逃避连字符,所以filter将返回结果? 我试图用Lucene论坛中的斜杠来逃避连字符,但是这并没有帮助。 另外,如果我将一个GUID值传入这个由花括号括起来的字段中,那么我需要小写字母字符,并且需要转义花括号呢? 谢谢

UTF8编码比最大长度32766长

我已经将我的Elasticsearch集群从1.1升级到1.2,并且在索引一个有点大的string时遇到了错误。 { "error": "IllegalArgumentException[Document contains at least one immense term in field=\"response_body\" (whose UTF8 encoding is longer than the max length 32766), all of which were skipped. Please correct the analyzer to not produce such terms. The prefix of the first immense term is: '[7b 22 58 48 49 5f 48 6f 74 65 6c […]

刷新VS刷新

如果一个新文档被索引到Elasticsearch索引,那么在索引操作之后它可用于search类似于1秒的东西。 但是可以通过在索引上调用_flush或_refresh操作来迫使它立即search。 这两个操作之间有什么区别 – 结果似乎是相同的,文件可以立即search。 这些操作中的每一个到底是什么? ES文档似乎没有深入解决这个问题。

如何将elasticsearch数据从一台服务器移动到另一台服务器

如何将Elasticsearch数据从一台服务器移动到另一台服务器? 我有服务器运行Elasticsearch 1.1.1在一个本地节点上有多个索引。 我想将这些数据复制到运行Elasticsearch 1.3.4的服务器B. 迄今为止的程序 在服务器和服务器上closuresES 将所有数据scp到新服务器上正确的数据目录。 (数据似乎位于/ var / lib / elasticsearch /我的debian框) 将权限和所有权更改为elasticsearch:elasticsearch 启动新的ES服务器 当我用ES头插件查看集群时,没有索引出现。 看来,数据没有加载。 我错过了什么吗?

ElasticSearch作为主要数据存储的可靠性如何,可以抵御写入损失,数据可用性等因素

我正在开发一个项目,要求提供一个通用仪表板,用户可以在其中进行不同types的分组,筛选和向下钻取。 为此,我们正在寻找一个允许切片和骰子数据的search商店。 将有多个数据源,并将其存储在search存储中。 源数据可能需要一些预先计算,这可以通过中间组件完成。 我已经浏览了几个博客,了解ES是否可以可靠地用作主数据存储。 它主要取决于我们正在寻找的用例。 关于用例的一些信息我们有: 每年大约有3亿条logging,1-2 KB。 假设存储1年的数据,我们现在有300 GB的数据,但随着数据的增长,用例可能会高达400-500 GB。 截至目前还不确定,我们将如何推动数据,但是大致上,每5分钟可以达到2-3百万条logging。 search请求很低,但需要复杂的查询,可以search过去6周到6个月的数据。 文档将在文档中的几乎所有字段中被索引。 有些博客表示,它足够可靠,可以用作主数据存储 – http://chrisberkhout.com/blog/elasticsearch-as-a-primary-data-store/ http://highscalability.com/blog/2014/1/6/how-hipchat-stores-and-indexes-billions-of-messages-using-el.html https://karussell.wordpress.com/2011/07/13/jetslide-uses-elasticsearch-as-database/ 有些博客说,ES有一些限制 – https://www.found.no/foundation/elasticsearch-as-nosql/ https://www.found.no/foundation/crash-elasticsearch/ http://www.quora.com/Why-should-I-NOT-use-ElasticSearch-as-my-primary-datastore 有没有人使用Elastic Search作为数据的唯一事实,而没有像PostgreSQL,DynamoDB或RDS这样的主存储? 我曾经看过ES有一些问题,比如分裂的大脑和索引腐败,那里可能会有数据丢失的问题。 所以我想知道是否有人使用过ES,并且遇到过数据上的麻烦 谢谢。

将JSON文件导入/索引到Elasticsearch

我是Elasticsearch的新手,直到现在都已经手动input数据。 例如,我做了这样的事情: $ curl -XPUT 'http://localhost:9200/twitter/tweet/1' -d '{ "user" : "kimchy", "post_date" : "2009-11-15T14:12:12", "message" : "trying out Elastic Search" }' 我现在有一个.json文件,我想索引到Elasticsearch。 我试过这样的事情没有成功: curl -XPOST 'http://jfblouvmlxecs01:9200/test/test/1' -d lane.json 如何导入.json文件? 我需要先采取哪些步骤来确保映射是正确的?

为什么在elasticsearch中需要“存储”:“是”?

我真的不明白为什么在核心types链接它说在属性描述(例如一个数字): 存储 – 设置为是将实际字段存储在索引中,否则不存储。 默认为no(注意, JSON文档本身是存储的,可以从中检索 ) index – 如果不应该索引该值,则设置为no。 在这种情况下,应该将商店设置为“是”,因为如果它没有被索引并且没有被存储, 则与它无关 两个大胆的部分似乎相矛盾。 如果"index":"no", "store":"no"我仍然可以从源头获得价值。 例如,如果我有一个包含URL的字段,这可能是一个很好的用法。 没有? 我有一个小实验,在那里我有两个映射,一个字段被设置为"store":"yes" ,另一个字段被设置为"store":"yes" "store":"no" 。 在这两种情况下,我仍然可以在我的查询中指定: {"query":{"match_all":{}}, "fields":["my_test_field"]} 我得到了同样的答案,返回领域。 我认为如果"store"被设置为"no"那么就意味着我无法检索到特定的字段,但是必须得到整个资源并在客户端进行parsing。 那么,将"store"设置为"yes"有什么好处呢? 如果我明确地从"_source"字段中排除字段,这只是相关的吗?

弹性search:“术语”,“匹配短语”和“查询string”之间的区别

这里有新的弹性search,并试图更好地了解这些查询之间的差异。 据我所知, term匹配一个单词(匹配工作需要小写),并且match phrase和query string匹配一串文本。

如何findElasticSearch安装插件的位置?

我已经安装elasticsearch与brew install elasticsearch 。 我的插件似乎位于/usr/local/Cellar/elasticsearch/0.19.8/plugins 。 用cat $( which plugin )我看到一个包含正确path的ES_HOMEvariables。 有没有办法问ES_HOME或插件目录弹性? 编辑 我正在寻找的是插件可执行文件用来安装插件的目录,当我做plugin -install something 。 我想在脚本中使用该path来启动弹性search。

ElasticSearch – 根据字段值增强相关性

需要在ElasticSearch中find一种方法来提高基于字段特定值的文档的相关性。 具体而言,在我的所有文档中,字段值越高,包含该文档的文档的相关性应该越高,而不pipesearch结果如何。 考虑下面的文档结构: { "_all" : {"enabled" : "true"}, "properties" : { "_id": {"type" : "string", "store" : "yes", "index" : "not_analyzed"}, "first_name": {"type" : "string", "store" : "yes", "index" : "yes"}, "last_name": {"type" : "string", "store" : "yes", "index" : "yes"}, "boosting_field": {"type" : "integer", "store" : "yes", "index" : "yes"} } } 我希望boosting_field值更高的文档比boosting_field值更低的文档具有内在的相关性 […]