嘉宾介绍(排名不分先后)

李捷
Elastic 高级解决方案架构师
Elastic 高级解决方案架构师,15年IT从业经验,Elasticsearch 真爱粉,喜欢在不同技术和具体解决方案上做探索。
演讲:Elastic Search Platform 与 NLP
随着 NLP 技术的持续发展以及对精准搜索越来越频繁的需求,在需要准确理解用户表达和需求的领域,如O2O搜索,舆情监控,用户喜好度分析,问答系统等,往往需要情感分析,命名实体识别,语义搜索,分类分析等自然语言处理技术与 Elasticsearch 一起提供技术支撑。然而过高的技术准入和成本门槛,让很多用户难以简单的快速构架一套方案用于业务尝试。本次分享,以 Elasticsearch 8.0 beta 版本为基础,为大家介绍 Elasticsearch 与 NLP 快速结合的一种简单方案
朱杰
Elastic 高级解决方案架构师
专注于 Elastic Stack 的解决方案的设计和咨询。在加入 Elastic 之前,Jerry 有十五年软件开发经验,涉及服务器端程序、Web、移动开发等多个领域。在大数据分析领域也有十年实践经验,熟悉 Hadoop 生态、Elastic Stack。
演讲:Elastic Stack 7、8新功能在各种业务场景下的应用
从2019年4月11日发布7.0到2021年12月8日发布7.16,历时2年8个月,17个功能版本,是Elastic历史上跨度最长,版本最多的系列。 而社区很多用户还停留在5和6版本,对于很多7的新功能并没有全面的了解。在这个主题里面我会把新功能分门别类,并放到具体的业务场景里面去介绍,从而让听众可以高效地掌握这些新功能的设计目的和应用场景。
刘凡
谷歌 架构师 - 容器/DevOps领域专家
刘凡拥有16年从事软件研发和技术创新工作经验,曾先后就职于Google、Pivotal/VMware、Adobe中国研发中心、IBM等大型国内外IT企业,从事软件产品研发,系统架构设计,研发管理等工作。在十多年的软件行业从业经历中,积累了丰富的分布式系统架构设计、自动化平台运维和系统稳定性调优等相关经验。近期主要专注于微服务云原生应用的开发和设计,支持多个知名客户企业进行数字化转型,对CI/CD,DevOps,敏捷开发和传统巨石应用拆分以及上云迁移拥有丰富的实战经验。
演讲:Elastic 和数据引擎在 k8s 上的最佳实践
刘凡将给大家分享Elastic Stack在k8s上的实战经验总结,更会进一步解析分布式数据引擎在k8s背后得到良好支撑的关键技术,例如:StatefuleSet、Operator等等。最后会给大家带来谷歌在基于容器平台的混合云尖端技术剖析,为大家部署、管理异地、多集群点亮一盏明灯。
高攀
腾讯云ES负责人
近10年 Elasticsearch 研发经验,全面负责腾讯云 Elasticsearch 服务的产品研发及商业化运营工作。
演讲:腾讯 Elasticsearch 云原生架构探索实践
腾讯云 Elasticsearch 服务于腾讯内外部广大的客户群体和业务场景。为了持续帮助客户降本增效,腾讯云ES基于云原生能力不断进行架构升级,重点研发了存算分离、索引自治、数据集成等核心特性,并进一步向完全无服务化的 Serverless 架构演进,用户无需感知底层集群和服务器,按量付费,帮助客户大幅降低软硬件成本和运维成本。
魏子珺
阿里巴巴技术专家
阿里云 Elasticsearch 内核专家,Elasticsearch Top 100 Contributer
演讲:用 Elasticsearch 做 TSDB-阿里云与 Elastic社区在时序引擎共建的技术分享
时序数据是ES可观察性很关键的一类场景,当前使用ES存储时序数据存在最佳实践使用门槛过高,存储容量过大,查询语句复杂等问题。阿里云联合Elastic社区共同打造的时序引擎,旨在降低用户的使用门槛,提供高性能、低成本的TSDB。本次分享会介绍ES最新的TSDB特性的设计和原理
黄杨锋
字节跳动 ByteES 团队负责人
目前就职于字节跳动产品研发和工程架构部,全面负责ByteES(Bytedance Elasticsearch)的研发和运营工作,致力于为公司各业务提供又快又稳又好用的ES服务,为业务赋能。此前曾服务于华为、腾讯等公司,在后端开发和大数据方面有近十年经验。
演讲:Elasticsearch 在字节跳动的实践
ES在字节有着非常广泛的应用,不论是常规的全文检索和日志搜索,还是结构化搜索、POI搜索、向量检索均可看见ES的身影。但如何让业务用好ES,依然还是任重道远,本次分享主要介绍ByteES团队在服务全公司业务时所做的一些实践和探索。
分享内容:
ByteES 之应用
ByteES 之架构
ByteES 之生态
ByteES 之容器
ByteES 之未来
刘刚
photoplus CTO
哈尔滨工程大学信息安全专业 学士;人人网开放平台Java工程师,负责基础模块和搜索模块;网信金融新业务部门高级Java工程师,负责基本架构、搜索业务和推荐业务;目前负责 photoplus 谱时智能云的整体架构和研发;2014年 Elasticsearch 中国技术分享会分享嘉宾。
演讲:10亿级人脸搜索的实践和优化
图片直播领域为了满足用户快速获取照片的需求,需要人脸搜索的需求。最初用第三方的付费接口,但是有诸多限制,比如人脸库有上限,单次搜索只能返回5个结果,一段时间后已经不满足业务需求。
1.前期考察技术可行性,es7.0已经提供dense_vector向量数据类型但是还没有提供搜索接口
2.用搜索脚本验证方案可行性,测试准确度,稳定性,关注最新future发布计划
3.根据业务计划,压测服务,得出技术指标,规划服务器规模
4.持续优化到支撑10亿人脸库搜索,怎么省钱
5.100亿人脸库搜索的下一步规划
陈曦
腾讯 Elasticsearch 托管平台负责人
腾讯 Elasticsearch Service/CTSDB 后台开发者,负责开发腾讯 Elasticsearch 自研 OffHeap 特性、从0到1构建运营系统、智能诊断系统
演讲:腾讯 Elasticsearch 服务自治探索实践
Elasticsearch 海量运营,服务自治,运营效率提升秘籍:
1. 自治索引:用户零介入索引管理解决方案,生命周期全托管,全自动索引创建、滚动、分片调整、查询裁剪。
2. 智能诊断:智能排障系统,自发现,自定位,自恢复,降低MTTR,释放运营人力。
3. 自动扩缩容:集群自动弹性伸缩,向 serverless 迈进。
赵弘扬
阿里云ES产品负责人
6年云计算大数据方向2B商业化产品从业经历,带领团队主导阿里云检索与分析 Elasticsearch 产品设计、迭代、生态及商业化相关工作。
演讲:阿里云 Elasticsearch 日志全观测 Serverless 服务能力解读
企业在使用ELK在应对日志场景的需求时,在成本、日志容灾、冷热多级存储、横向扩展效率、并发性能及稳定性相关问题上,往往需要投入不少集成封装,机器冗余,运维相关的人和资源的投入。阿里云 Elasticsearch 通过 Serverless 的方式,充分利用云端的服务化产品能力的优势,帮助企业解决痛点问题,助力企业的数字化转型。
钱雨欣
阿里云ES高级产品经理
花名沐泽,主要负责阿里云 Elasticsearch 引擎及服务化产品及商业化,基于云原生引擎在泛日志检索场景的能力增强,与 Serverless 服务化形态演进,为云上用户实现更低成本与更低门槛的使用体验。
演讲:Elasticsearch Serverless 服务化在人群平台的日志可观测应用
开源 Elasticsearch 在大规模日志检索应用中,往往面临日志流量吞吐大、存储配置复杂带来性能、成本、稳定性的多重局限。阿里云 Elasticsearch 作为首家提供 Elasticsearch Serverless 服务的云厂商,通过对最新云原生 Serverless 版本的产品及技术架构解读,结合其在阿里巴巴集团内人群平台日志可观测场景最佳实践,看 ES Serverles 服务化如何帮助用户减少技术使用成本,持续提升解决业务问题的能力。
邹博引
XSKY 产品总监
演讲:SDS 与 Elasticsearch 的碰撞
作为行业领先的软件定义存储(SDS)厂商,XSKY在产品中通过ES向客户提供了丰富的集群监控管理和数据管理功能。在面对海量数据时,如何提高查询效率,降低ES存储成本,ES如何适应混合云、跨地域部署的场景,XSKY进行了思考和实践。XSKY产品能很好的与ES联动,作为ES冷数据分层目标,再结合数据流动特性,进一步拓展ES分层及快照功能的应用场景。本演讲将介绍XSKY产品中ES的使用场景,以及存储与ES联动进行数据存储优化和生命周期管理。
郭嘉梁
阿里巴巴技术专家
郭嘉梁,阿里巴巴技术专家,2017年加入阿里巴巴,负责阿里云 Elasticsearch 日志存储引擎的研发工作,致力于为用户提供海量日志场景下,高可用、高性能、低成本的搜索分析服务。
演讲:阿里云 Elasticsearch 面向海量日志存储的优化思路与心法
阿里云 Elasticsearch 面向海量日志的分析检索场景,提供了高性价比的 Openstore 多级存储解决方案,使总体部署成本降低了60%。 本次演讲旨在分享 Openstore 多级存储架构,以及引擎内核的优化思路,主要包括:
1. Openstore 多级存储架构
2. 查询性能优化方案
3. 智能缓存技术
4. 查询的资源隔离技术
5. 阿里云ES日志存储的未来规划。
鲍捷
文因互联董事长,创始人,博士
鲍捷博士,文因互联董事长,创始人。爱荷华州立大学(Iowa State University)博士,伦斯勒理工学院(RPI)博士后,麻省理工学院(MIT)分布式信息组(DIG)访问研究员。曾任三星美国研发中心研究员,曾任 W3C OWL(Web本体语言)工作组成员,参与撰写了OWL2 知识图谱语言国际标准。现任W3C(万维网联盟)顾问委员会委员、中国中文信息学会语言与知识计算专业委员会委员、金融知识图谱工作组主席、中文开放知识图谱联盟(OpenKG)发起人之一,国际Data Intelligence杂志编委。
演讲:用 Elasticsearch 实现知识本体查询
Elasticsearch 经常被用于知识图谱的搜索和查询。除了简单的实例数据的检索,如何用 Elasticsearch 实现较高级的知识推理呢?本讲座探讨用ES实现知识图谱语言OWL的部分表达力的一些方法
毕杰山
腾讯 Elasticsearch 内核团队专家专家工程师
腾讯 Elasticsearch 内核团队专家工程师,拥有丰富的NoSQL领域架构经验,对NoSQL/多模领域的技术有广泛涉猎,曾担任华为大数据团队HBase领域架构师。
演讲:腾讯 Elaticsearch 在日志存储领域的系统性优化
日志类数据存储与分析是腾讯 Elasticsearch 服务的最主流应用场景,围绕"降低存储成本"与"查询提速"两大目标,腾讯 Elasticsearch 在架构与内核上做了一系列的改进。
本演讲涉及到的内容包括:
1. 支持混合存储介质的日志存储引擎;
2. Segment 级别的数据复制协议;
3. Lucene 索引引擎的压缩编码优化;
4. 时间区间查询的深度优化。
王文谦
vivo互联网 技术经理
vivo互联网搜索中台技术负责人
演讲:Elasticsearch 在 vivo 搜索中台的实践
1.简单介绍vivo搜索中台的架构。
2.介绍ES在vivo搜索中台的应用。
3.介绍如何通过插件开发强化ES在搜索中台的能力。(自研分词插件,精排插件,特征提取插件等)以及解决的搜索业务问题。
4.介绍一些关于插件开发的性能优化,稳定性提升等(附加)。
邱锦森
腾讯CDC高级工程师
Sam,腾讯CDC高级工程师,2015年加入腾讯,从2012年开始使用 Elasticsearch 0.19,ELK,Elastic Stack,并推动 Elasticsearch 在腾讯CDC产品中落地使用
演讲:Elasticsearch 在腾讯问卷的应用
腾讯问卷是腾讯CDC根据多年问卷调查研究经验自主开发的在线问卷调查平台,该平台前身是腾讯内部用户、市场、产品研究的重要工具,于2015年正式对外开放。Elasticsearch 支撑了腾讯问卷由 ES 2.0 开始至 5.x,6.x,7.x 版本,集群规模达1000亿数据,数十TB。支撑了腾讯问卷的日志监控告警、20亿数据自定义字段的搜索过滤、统计分析与交叉分析。
汤明
字节跳动 高级开发工程师
演讲:Elasticsearch mini batch loader - 海量导入实时索引外部构建方案
ES在字节跳动有着大规模的使用。为了应对实时数据的快速增长、提供极高的写入性能、降低读写资源竞争,我们基于Flink实现了在ES集群之外以mini batch的方式实时构建索引并传输至ES集群的方案,单节点写入速度达到每秒近百万,相较于离线外部构建索引的方式,实时外部构建索引的主要难点是数据一致性问题,本次分享将介绍期间遇到的主要困难,解决方案,以及详细的性能指标。
刘岩
Cloudera 解决方案工程师
刘岩 Cloudera 解决方案工程师, Apache Flink Contributor,Apache Hive Contributor
演讲:使用 Apache Flink 和 Elasticsearch 打造实时日志聚合系统
分布式系统常见的一个运维需求是通过聚合各个节点的日志来形成统一视图来方便寻找潜在故障或定位已有故障的根因。本次分享涵盖
1. 实时处理系统的日志收集需求和挑战
2. 日志聚合系统的基本设计原则
3. 如何通过Apache Flink和 Elasticsearch 以及Apache Kafka 来实现这个系统
杨孔仕
阿里巴巴技术专家
杨孔仕,花名志宸,阿里巴巴技术专家,阿里云 Elasticsearch 团队内核开发
演讲:当开源遇到云原生-阿里云 Elasticsearch 内核持续优化技术分享
阿里 Elasticsearch 团队致力于提供高性能、低成本、高可用的搜索分析能力,服务于阿里云 Elasticsearch 产品云上用户以及阿里集团内部用户,现已稳定支持数万 Elasticsearch 集群和数十PB的海量数据,本次分享主要介绍阿里 Elasticsearch 在内核上的持续优化,包括
1. 日志增强版 serverless 化架构 (indexing service + openstore)
2. 索引压缩
3. 动态热点负载均衡
4. 多租户隔离与限流
顾明
腾讯微信支付高级工程师
顾明,腾讯微信支付高级工程师,支付领域 Elasticsearch 内核研发负责人。
演讲:PB级安全可靠的 Elasticsearch 优化
很多时候大家都在关注ES的灵活性,功能,成本,性能。在金融领域,除了关心上面的技术外,会要求更高的可靠性,安全性。进一步,当数据达到PB级后,达成这些目标变得困难,本次分享尝试探讨下面内容:
在PB级数据场景下,针对 Elasticsearch 的安全性、可靠性所做的深入改进。
1,数据持续增长,无消亡,PB级集群的均衡。解决原生版本大集群数据倾斜问题。
2,不中断业务下的通讯加密切换。解决原生版本需要整体重启集群切换通讯加密的问题。
3,损失更小的跨城同步尝试。比同类方案数据同步延迟低28%(更低rpo),cpu负载低57%(更高的业务上限)