嘉宾介绍(排名不分先后)

李捷
Elastic 高级解决方案架构师
Elastic 高级解决方案架构师,15年IT从业经验,Elasticsearch 真爱粉,喜欢在不同技术和具体解决方案上做探索。
演讲:Elastic Stack 与 NLP
随着 NLP 技术的持续发展以及对精准搜索越来越频繁的需求,在需要准确理解用户表达和需求的领域,如O2O搜索,舆情监控,用户喜好度分析,问答系统等,往往需要情感分析,命名实体识别,语义搜索,分类分析等自然语言处理技术与 Elasticsearch 一起提供技术支撑。然而过高的技术准入和成本门槛,让很多用户难以简单的快速构架一套方案用于业务尝试。本次分享,以 Elasticsearch 8.0 beta 版本为基础,为大家介绍 Elasticsearch 与 NLP 快速结合的一种简单方案
朱杰
Elastic 高级解决方案架构师
专注于 Elastic Stack 的解决方案的设计和咨询。在加入 Elastic 之前,Jerry 有十五年软件开发经验,涉及服务器端程序、Web、移动开发等多个领域。在大数据分析领域也有十年实践经验,熟悉 Hadoop 生态、Elastic Stack。
演讲:Elastic Stack 7系新功能在各种业务场景下的应用
从2019年4月11日发布7.0到2021年12月8日发布7.16,历时2年8个月,17个功能版本,是Elastic历史上跨度最长,版本最多的系列。 而社区很多用户还停留在5和6版本,对于很多7的新功能并没有全面的了解。在这个主题里面我会把新功能分门别类,并放到具体的业务场景里面去介绍,从而让听众可以高效地掌握这些新功能的设计目的和应用场景。
演讲:从 ELK 到 EFK —结合 Flink 和 Elasticsearch 新特性重构全观测方案
在企业业务系统越发复杂的今天,日志的并发量越来越高,传统的ELK架构,受制于Logstash在性能、稳定性上的局限性,在解决日志全观测相关问题时会遇到或多或少的问题。看看阿里云基于EFK(Elasticsearch+Flink+Kibana)的解决方案,是如何解决相关问题的。
刘凡
谷歌 架构师 - 容器/DevOps领域专家
刘凡拥有16年从事软件研发和技术创新工作经验,曾先后就职于Google、Pivotal/VMware、Adobe中国研发中心、IBM等大型国内外IT企业,从事软件产品研发,系统架构设计,研发管理等工作。在十多年的软件行业从业经历中,积累了丰富的分布式系统架构设计、自动化平台运维和系统稳定性调优等相关经验。近期主要专注于微服务云原生应用的开发和设计,支持多个知名客户企业进行数字化转型,对CI/CD,DevOps,敏捷开发和传统巨石应用拆分以及上云迁移拥有丰富的实战经验。
演讲:Elastic 和数据引擎在 k8s 上的最佳实践
刘凡将给大家分享Elastic Stack在k8s上的实战经验总结,更会进一步解析分布式数据引擎在k8s背后得到良好支撑的关键技术,例如:StatefuleSet、Operator等等。最后会给大家带来谷歌在基于容器平台的混合云尖端技术剖析,为大家部署、管理异地、多集群点亮一盏明灯。
姜国强
腾讯云专家工程师
腾讯TEG OLAP内核研发Leader,负责腾讯 Elasticsearch、云原生数仓、时序数据库等系统的研发工作,为腾讯云、公司内用户提供高性价比、服务化、智能化的数据分析服务。曾负责百度大数据OLAP分析相关工作,原Apache Doris存储层负责人。从事技术研发工作10年+,专注于大数据、数据库、分布式系统相关领域。
演讲:腾讯 Elasticsearch 云原生架构探索实践
Elasticsearch(ES)作为开源首选的分布式搜索分析引擎,通过一套系统轻松满足用户的可观测性分析、企业搜索、安全分析等多种需求,大幅降低大数据时代挖掘数据价值的成本。腾讯在公司内部丰富的场景中大规模使用ES,同时联合Elastic公司在腾讯云上提供内核增强版的ES云服务。大规模、丰富的应用场景推动着腾讯对ES进行云原生架构升级,满足用户高性价比、服务化、智能化的数据分析服务。
本次分享的主要内容如下:
1. ES 在腾讯的应用简介;
2. 云原生架构之高性价比;
3. 云原生架构之服务化;
4. 云原生架构之多源多模融合。
魏子珺
阿里巴巴技术专家
阿里云 Elasticsearch 内核专家,Elasticsearch Top 100 Contributer
演讲:用 Elasticsearch 做 TSDB-阿里云与 Elastic社区在时序引擎共建的技术分享
时序数据是ES可观察性很关键的一类场景,当前使用ES存储时序数据存在最佳实践使用门槛过高,存储容量过大,查询语句复杂等问题。阿里云联合Elastic社区共同打造的时序引擎,旨在降低用户的使用门槛,提供高性能、低成本的TSDB。本次分享会介绍ES最新的TSDB特性的设计和原理
黄杨锋
字节跳动 ByteES 团队负责人
目前就职于字节跳动产品研发和工程架构部,全面负责ByteES(Bytedance Elasticsearch)的研发和运营工作,致力于为公司各业务提供又快又稳又好用的ES服务,为业务赋能。此前曾服务于华为、腾讯等公司,在后端开发和大数据方面有近十年经验。
演讲:Elasticsearch 在字节跳动的实践
ES在字节有着非常广泛的应用,不论是常规的全文检索和日志搜索,还是结构化搜索、POI搜索、向量检索均可看见ES的身影。但如何让业务用好ES,依然还是任重道远,本次分享主要介绍ByteES团队在服务全公司业务时所做的一些实践和探索。
分享内容:
ByteES 之应用
ByteES 之架构
ByteES 之生态
ByteES 之容器
ByteES 之未来
刘刚
photoplus CTO
哈尔滨工程大学信息安全专业 学士;人人网开放平台Java工程师,负责基础模块和搜索模块;网信金融新业务部门高级Java工程师,负责基本架构、搜索业务和推荐业务;目前负责 photoplus 谱时智能云的整体架构和研发;2014年 Elasticsearch 中国技术分享会分享嘉宾。
演讲:10亿级人脸搜索的实践和优化
图片直播领域为了满足用户快速获取照片的需求,需要人脸搜索的需求。最初用第三方的付费接口,但是有诸多限制,比如人脸库有上限,单次搜索只能返回5个结果,一段时间后已经不满足业务需求。
1.前期考察技术可行性,es7.0已经提供dense_vector向量数据类型但是还没有提供搜索接口
2.用搜索脚本验证方案可行性,测试准确度,稳定性,关注最新future发布计划
3.根据业务计划,压测服务,得出技术指标,规划服务器规模
4.持续优化到支撑10亿人脸库搜索,怎么省钱
5.100亿人脸库搜索的下一步规划
王星
腾讯云高级工程师
starlywang在ES全文检索功能基础上,拓展自定义打分、监控体系、文本半自动标注,支持广告召回等精细化推荐场景。作为TencentES Oteam 成员,主动推进ES个性化评分、监控、检索优化通用化建设,并持续维护,兼容ES5.6.10及以上所有版本,目前已稳定运营10多个大型集群,日构建亿级索引,日均检索五千万以上,服务30多个业务。
演讲:ElasticSearch 自定义评分及其在广告推荐中的应用
ES自定义评分及其在广告推荐中的应用
ES应用一:索引自定义评分
ES应用二:检索自定义评分
ES应用三:文本半自动标注
项目应用效益
赵弘扬
阿里云ES产品负责人
6年云计算大数据方向2B商业化产品从业经历,带领团队主导阿里云检索与分析 Elasticsearch 产品设计、迭代、生态及商业化相关工作。
演讲:阿里云 Elasticsearch 日志全观测 Serverless 服务能力解读
企业在使用ELK在应对日志场景的需求时,在成本、日志容灾、冷热多级存储、横向扩展效率、并发性能及稳定性相关问题上,往往需要投入不少集成封装,机器冗余,运维相关的人和资源的投入。阿里云Elasticsearch通过Serverless的方式,充分利用云端的服务化产品能力的优势,帮助企业解决痛点问题,助力企业的数字化转型。
演讲:从 ELK 到 EFK —结合 Flink 和 Elasticsearch 新特性重构全观测方案
在企业业务系统越发复杂的今天,日志的并发量越来越高,传统的ELK架构,受制于Logstash在性能、稳定性上的局限性,在解决日志全观测相关问题时会遇到或多或少的问题。看看阿里云基于EFK(Elasticsearch+Flink+Kibana)的解决方案,是如何解决相关问题的。
邹博引
XSKY 产品总监
演讲:SDS 与 Elasticsearch 的碰撞
作为行业领先的软件定义存储(SDS)厂商,XSKY在产品中通过ES向客户提供了丰富的集群监控管理和数据管理功能。在面对海量数据时,如何提高查询效率,降低ES存储成本,ES如何适应混合云、跨地域部署的场景,XSKY进行了思考和实践。XSKY产品能很好的与ES联动,作为ES冷数据分层目标,再结合数据流动特性,进一步拓展ES分层及快照功能的应用场景。本演讲将介绍XSKY产品中ES的使用场景,以及存储与ES联动进行数据存储优化和生命周期管理。
郭嘉梁
阿里巴巴技术专家
郭嘉梁,阿里巴巴技术专家,2017年加入阿里巴巴,负责阿里云Elasticsearch日志存储引擎的研发工作,致力于为用户提供海量日志场景下,高可用、高性能、低成本的搜索分析服务。
演讲:阿里云 Elasticsearch 面向海量日志存储的优化思路与心法
阿里云 Elasticsearch 面向海量日志的分析检索场景,提供了高性价比的Openstore多级存储解决方案,使总体部署成本降低了60%。 本次演讲旨在分享Openstore多级存储架构,以及引擎内核的优化思路,主要包括:
1. Openstore多级存储架构
2. 查询性能优化方案
3. 智能缓存技术
4. 查询的资源隔离技术
5. 阿里云ES日志存储的未来规划。
鲍捷
文因互联董事长,创始人,博士
鲍捷博士,文因互联董事长,创始人。爱荷华州立大学(Iowa State University)博士,伦斯勒理工学院(RPI)博士后,麻省理工学院(MIT)分布式信息组(DIG)访问研究员。曾任三星美国研发中心研究员,曾任 W3C OWL(Web本体语言)工作组成员,参与撰写了OWL2 知识图谱语言国际标准。现任W3C(万维网联盟)顾问委员会委员、中国中文信息学会语言与知识计算专业委员会委员、金融知识图谱工作组主席、中文开放知识图谱联盟(OpenKG)发起人之一,国际Data Intelligence杂志编委。
演讲:用 Elasticsearch 实现知识本体查询
Elasticsearch 经常被用于知识图谱的搜索和查询。除了简单的实例数据的检索,如何用 Elasticsearch 实现较高级的知识推理呢?本讲座探讨用ES实现知识图谱语言OWL的部分表达力的一些方法
梁成
腾讯云专家工程师
梁成 腾讯计算机系统有限公司 高级工程师就职于腾讯云,从事运营开发工作,个人热衷开源技术、前沿技术的探索与研究,现致力于用ELK基于云原生来构建云内部日志运营中台,解决云产品生产环境日志精细化运营等相关问题。
演讲:All in ElasticSearch 构建运营开发能力体系
随着技术的更新发展,运营开发可选择的技术体系越来越多,在这些纷繁复杂的技术方案中如何单纯基于es来构建运营开发体系,简化技术栈,这是我们本次需要探讨的话题,子主题:
1. All in ElasticSearch
2. 云环境可观测性实践
3. NoSQL开发框架
4. 腾讯云内部实践
5. 更轻量的日志方案
高治理
新智锦绣 技术总监
高治理,现任职于新智锦绣科技(北京)有限公司,从事ES技术服务及配套工具开发工作。曾在甲乙方立场上以实施交付、技术架构、方案售前、团队管理等角色推进过多个信息化、大数据等项目,关注数字化企业的技术实践与模式建设。
演讲:基于 Elastic Stack 的全域数据获取与流动性观测
在迅猛迭代的技术趋势,推陈出新的架构策略,花样百出的数据实践背景下,无论是多中心、分布式,亦或是微服务、云原生,如何审视应用程序运行所依赖的那些看似简单又“深不见底”的软硬资源负载关系和存算复杂又“四分五裂”的数据资源流转关系?此次分享将围绕控制Beat实现对软硬件资源负载关系的数据获取和使用Elasticsearch实现对数据资源流动性任务观测等两个项目实践展开,从而探讨全域数据的取用协同模式及配套工具建设。
王文谦
vivo互联网 技术经理
vivo互联网搜索中台技术负责人
演讲:Elasticsearch 在 vivo 搜索中台的实践
1.简单介绍vivo搜索中台的架构。
2.介绍ES在vivo搜索中台的应用。
3.介绍如何通过插件开发强化ES在搜索中台的能力。(自研分词插件,精排插件,特征提取插件等)以及解决的搜索业务问题。
4.介绍一些关于插件开发的性能优化,稳定性提升等(附加)。
邱锦森
腾讯CDC高级工程师
Sam,腾讯CDC高级工程师,2015年加入腾讯,从2012年开始使用 Elasticsearch 0.19,ELK,Elastic Stack,并推动 Elasticsearch 在腾讯CDC产品中落地使用
演讲:Elasticsearch 在腾讯问卷的应用
腾讯问卷是腾讯CDC根据多年问卷调查研究经验自主开发的在线问卷调查平台,该平台前身是腾讯内部用户、市场、产品研究的重要工具,于2015年正式对外开放。Elasticsearch 支撑了腾讯问卷由 ES 2.0 开始至 5.x,6.x,7.x 版本,集群规模达1000亿数据,数十TB。支撑了腾讯问卷的日志监控告警、20亿数据自定义字段的搜索过滤、统计分析与交叉分析。
汤明
字节跳动 高级开发工程师
演讲:Elasticsearch mini batch loader - 海量导入实时索引外部构建方案
ES在字节跳动有着大规模的使用。为了应对实时数据的快速增长、提供极高的写入性能、降低读写资源竞争,我们基于Flink实现了在ES集群之外以mini batch的方式实时构建索引并传输至ES集群的方案,单节点写入速度达到每秒近百万,相较于离线外部构建索引的方式,实时外部构建索引的主要难点是数据一致性问题,本次分享将介绍期间遇到的主要困难,解决方案,以及详细的性能指标。
刘岩
Cloudera 解决方案工程师
刘岩 Cloudera 解决方案工程师, Apache Flink Contributor,Apache Hive Contributor
演讲:使用 Apache Flink 和 Elasticsearch 打造实时日志聚合系统
分布式系统常见的一个运维需求是通过聚合各个节点的日志来形成统一视图来方便寻找潜在故障或定位已有故障的根因。本次分享涵盖
1. 实时处理系统的日志收集需求和挑战
2. 日志聚合系统的基本设计原则
3. 如何通过Apache Flink和 Elasticsearch 以及Apache Kafka 来实现这个系统
谭巍
四川新网银行 高级大数据开发工程师
飞熊,从事大数据开发5年,现任四川新网银行高级大数据开发工程师,主要负责新网银行实时计算大数据开发。热爱技术实战,对 Apache Flink ,Apache spark 以及 Elasticsearch 都有一定的理解和认识。
演讲:基于 Elasticsearch 的数据中台在新网银行的应用
介绍新网银行基于 Elasticsearch 的数据中台建设,通过该案例分享在金融领域上的案例。介绍新网银行在 Elasticsearch 方面做的优化和改造,如对接LDAP认证管理,实现CCR功能和打通星环大数据平台等;同时分享优化es索引的经验。
杨孔仕
阿里巴巴技术专家
杨孔仕,花名志宸,阿里巴巴技术专家,阿里云 Elasticsearch 团队内核开发
演讲:当开源遇到云原生-阿里云 Elasticsearch 内核持续优化技术分享
阿里 Elasticsearch 团队致力于提供高性能、低成本、高可用的搜索分析能力,服务于阿里云Elasticsearch产品云上用户以及阿里集团内部用户,现已稳定支持数万Elasticsearch集群和数十PB的海量数据,本次分享主要介绍阿里Elasticsearch在内核上的持续优化,包括
1. 日志增强版serverless化架构 (indexing service + openstore)
2. 索引压缩
3. 动态热点负载均衡
4. 多租户隔离与限流
徐胜
原携程 Elasticsearch 技术专家
徐胜,曾先后在阿里巴巴本地生活服务公司、携程集团从事搜索推荐广告和ES业务平台的研发工作,支撑过几十条业务线的超大规模ES集群,积累了6年的搜索服务和大数据行业经验。
演讲:在线旅行场景下的 Elasticsearch 高可用和性能优化实战
在线旅游行业有着丰富的Elasticsearch的搜索应用场景,包括搜索查询场景、数据分析场景、筛选项过滤场景。本人本次主要是从搜索引擎架构的优化层面,来阐述一下具体的实战项目、优化效果,以及给整个公司带来的收益。
顾明
腾讯微信支付高级工程师
顾明,腾讯微信支付高级工程师,支付领域 Elasticsearch 内核研发负责人。
演讲:PB级安全可靠的 Elasticsearch 优化
很多时候大家都在关注ES的灵活性,功能,成本,性能。在金融领域,除了关心上面的技术外,会要求更高的可靠性,安全性。进一步,当数据达到PB级后,达成这些目标变得困难,本次分享尝试探讨下面内容:
在PB级数据场景下,针对Elasticsearch的安全性、可靠性所做的深入改进。
1,数据持续增长,无消亡,PB级集群的均衡。解决原生版本大集群数据倾斜问题。
2,不中断业务下的通讯加密切换。解决原生版本需要整体重启集群切换通讯加密的问题。
3,损失更小的跨城同步尝试。比同类方案数据同步延迟低28%(更低rpo),cpu负载低57%(更高的业务上限)