大会介绍

ESCC#3全称:The 3th Elasticsearch China Conference, 是由elasticsearch中文社区每年定期举办的线下交流活动,今年已经是第三届了,会议围绕elasticsearch及周边产品和技术,如:kibana\logstash\logging\nlp等相关领域及话题都可以进行讨论,只要是你认为可能会感兴趣的话题,都可以提交过来,分享嘉宾来自国内一线互联网公司,倡导干货接地气纯粹的技术交流.

会议日程

日期 时间 日程安排
10月25日
周六
13:00-13:30 入场报到
13:30-13:40 大会介绍
13:45-14:30 孙健, 《漫谈elasticsearch中的分词与检索》
14:40-15:25 饶琛琳, 《Kibana & More Kibana》
15:25-15:45 休息时间 & 自由交流 & 勾搭投资人
15:45-16:30 黄琛, 《介绍一种像google搜索一样方便的es查询api》
16:40-17:25 祝威廉, 《ES衍生系统介绍以及索引技术在数据部门的应用》
17:35-18:00 刘刚, 《elasticsearch的自定义排序》
18:00-18:10 自由发言 & 5分钟 Self-Presenation
18:20- ~~ 大会结束

嘉宾介绍

孙健

漫谈elasticsearch中的分词与检索

本次演讲主要讲两个非常实用的内容,随着搜索引擎的深入互联网应用,中文分词的需求也更加强烈,由NLPCN的发起人. Ansj同学根据自己的一些应用场景讲讲如何让分词和搜索引擎更好的结合.一起让我们的搜索更加智能.以及Ansj中文分词中一些鲜为人知的特性. 同时在某些场景中,我们用elasticsearch来担当数据分析的平台,但是原生的elasticsearch查询方式太过反人类. javaApi的调用方式侵入性和学习成本都比较高,于是让我们一起尝试利用sql语句来查询elasticsearch。

孙健

孙健

Ansj分词作者、NLPCN发起人、nlp-lang自然语言工具包发起人、主要从事检索、自然语言处理、数据挖掘等方面工作。

饶琛琳

Kibana & More Kibana

Kibana 是 Elasticsearch 重要的数据可视化项目。该演讲首先会对 Kibana 的主要功能和通用配置做一些演示,然后结合日志检索和故障分析方面的场景, 展示和讲解一个更定制化的 Kibana 。Elasticsearch 良好的 API 和 Kibana 的框架设计,使得定制工作异常简单。。

饶琛琳

饶琛琳

新浪网技术保障部系统架构师。

刘刚

elasticsearch的自定义排序

主要介绍elasticsearch文本打分之外的排序。主要讲解function score和topN的使用场景,还会讲一些具体使用时候的一些经验。 在面对产品和运营人员提出的各种复杂排序规则没法满足的时候,或者排序规则涉及到实时计算的时候, 或者运营人员还期望随时可以修改排序规则的时候,function score就能帮你大忙了。

刘刚

刘刚

网信金融架构组负责搜索,推荐 ,数据分析和处理。

祝威廉

ES衍生系统介绍以及索引技术在数据部门的应用

2011年 范凯Robin 推荐ES让我参考下,一接触便被其众多理念所折服。后来模仿ES我们完全重新开发了一个新的系统CS(不要笑,其实是CSearch的简称), 目标是简化ES,并且和现有的基础架构想融合,但接口API等和ES保持一致。演讲中会重点介绍我们删减了那些特性,新添加了那些特性, 如何与现有基础架构融合。对于数据部门而言,产生的成果主要是CS接口的方式提供出去,整个数据部门对存储的原则是精简, 目前只用HBase,CS,文件,Redis四个便囊括了所有系统功能,我们会详细介绍CS在各个应用场景中是如何被使用的。

祝威廉

祝威廉

ServiceFramework(https://github.com/allwefantasy/ServiceFramework)开源项目作者, 四年搜索相关, 产品即为该ES衍生系统,后同时从事数据挖掘&推荐&;机器学习相关,对大数据架构与研发有一定研究。

黄琛(C.Wong)

介绍一种像google搜索一样方便的es查询api

es官方提供api查询接口是采用json风格的语法采用来组织的,可读性非常好,但是对于编写者来说则费时费力。因为json本身是一种面向机器设计的文档格式,严格的语法和标点要求不利于人类快速编写而不出语法错误。相比而言,风靡世界的google搜索框则已经被证明是最高效也最易于掌握的并且能够表达复杂语义的人机交互界面。 想像一下,语法"INDEX=twitter age>20 | SORT user DESC"即可查询符合名称为twitter索引的和字段age大于20条件的数据并查询结果按照user倒序排列是不是要比写一个json要愉快一些。同样的,"INDEX=twitter | STATS SUM(upflow) BY user"可以表达分组和统计功能。关键字AND、OR、DC、MIN、MAX、AVG、EVAL、TIMESPAN、LIMIT等可以添加到查询语句中以表达更加复杂的语义。 我们按照易用性的原则重新为es设计并实现了这种查询api,采用es rest插件方式,命名为elasticsearch-rest-command并开源在github上。同时,我们还设计了一个ui来支持快速查询和浏览。 下面我将详细说明是如何使用javacc来实现支持这种命令+管道风格的语法解析并查询得到对应结果。

黄琛(C.Wong)

黄琛(C.Wong)

一家电信大数据行业创业公司技术负责人。

主办方

赞助商

会议地址

北京市 朝阳区
林翠东路1号院甲1号楼
北京国奥村花园酒店

已结束

大会PPT

大会PPT下载地址:

https://pan.baidu.com/s/1i5Q1VYP

下载
微信“扫一扫”分享给好友