ClickHouse Shenzhen User Group第1届 Meetup
收起
01
ClickHouse Shenzhen User Group活动介绍
本活动是由 ClickHouse 中国官方组织的线下技术交流活动。ClickHouse 的全球官方用户社区已经在 MeetUp网站上的 25 个城市组织了 meetup 活动,其中官方首届深圳 Meetup 活动即将于 2024年 1 月 6 日举行。
02
时间地点
沙龙时间:2024年1月6日
沙龙地点:广东省深圳市南山区海天二路33号 腾讯滨海大厦36层会议室
面向人群:ClickHouse 技术爱好者、开发者、运维、架构师等
03
日程安排
13: 30 ~ 13: 35 开场介绍
13: 35 ~ 14: 05 When ClickHouse Meets Iceberg - 微信湖仓读取实现
14:05 ~ 14:35 ClickHouse Query监控以及慢Query调优
14:35 ~ 15:05 ClickHouse在vivo ABTest的应用实践
15:05 ~ 15:20 合影&茶歇
15:20 ~ 15:50 NineData面向ClickHouse数据集成实践
15:50 ~ 16:20 大模型与ClickHouse
16:20 ~ 16:50 腾讯云TCHouse-C内核在Schema-less和数据实时更新的探索
16:50 ~ 17:30 问答&自由交流
04
主题分享
分享1:《When ClickHouse Meet Iceberg - 微信湖仓读取实现》
讲师:冯吕
腾讯 微信技术架构部 OLAP研发工程师
ClickHouse Collaborator & Active Contributor
分享概述:
数据湖查询与分析是当下OLAP领域的一个热门话题,在微信业务场景中同样具有强烈需求。尽管在ClickHouse社区代码中,我们过去已经实现了简单的读取S3上的数据湖文件的原型功能,例如Iceberg表文件的读取。然而由于Iceberg缺少C++ API,社区现有Iceberg读取实现不能基于Iceberg丰富的元数据结构进行分区剪裁、min-max索引剪裁等操作,每次查询都必须进行全表扫描,导致在实际生产环境中完全不可用。
本次分享会介绍微信如何在 ClickHouse 中实现高效地Iceberg数据湖查询能力,解决业务的数据湖分析需求。
分享2:《ClickHouse Query监控以及慢Query调优》
讲师:李晨霖
Shopee App & Mobile Frontend 的 APMS团队
负责团队内数据相关部分,包括数仓的搭建,有从零开始搭建一个企业级ClickHouse实时数仓的经验,公司内ClickHouse资深用户。
分享概述:
介绍如何基于system query log搭建一套可用的Query 监控。帮助团队快速定位异常执行的Query,解决生产问题。
目前大部分的ClickHouse应用场景还是存算不分离的情况。写入和读取都会占用CPU资源,异常的Query会长时间占用系统资源导致数据库处于不可用的状态。
Query类型的监控有助于帮助我们发现和解决这些问题。
分享join和in导致的长慢Query类型以及优化,没有踩到分区导致全表扫描的长慢Query 以及优化,replacingMergeTree使用过程中的问题以及心得。
分享3:《ClickHouse在vivo ABTest的应用实践》
讲师:刘兆坤
vivo互联网实验分析平台架构师
2016年入职中兴通讯,从事大数据工作,对大数据计算引擎源码有深入研究,参与开源贡献工作。2019年加入vivo,从事数据仓库开发工作,先后对接浏览器、内容平台、官网、账号、存量用户运营等业务。2020年开始负责实验效果分析模块的数据能力建设工作,从0-1设计数据计算架构
分享概述:
1. vivo ABtest平台计算架构介绍
2. ClickHouse如何帮助业务规避实验统计陷阱
3. ClickHouse在实验场景下的性能优化实践
4. 关于ClickHouse应用的未来规划
分享4:《NineData面向ClickHouse数据集成实践》
讲师:杨洋洋
玖章算术(浙江)科技有限公司 数据复制技术负责人
曾在阿里云研发了IDB/DMS等企业级管理平台产品。
目前负责NineData数据复制产品的基础架构、内核研发、数据库引擎集成等。
致力于将NineData打造成优秀的数据复制产品。
分享概述:
1. NineData云原生智能数据管理平台简介。主要介绍一下NineData系列产品产生背景和基本功能。
2. NineData云原生数据复制基础架构介绍。主要讲述NineData数据复制产品的基本原理和功能。
3. NineData集成数据到ClickHouse的实践。主要讲述NineData全量及实时增量集成数据到ClickHouse相关的技术实现。
4. NineData集成数据到ClickHouse的挑战与未来展望。主要讲述NineData在集成数据到ClickHouse的产品遇到的难题、优化方案、产品现状及未来的规划。
分享5:《大模型与ClickHouse》
讲师:陈峰
北京滴普科技有限公司 Fast5000E产品PDT 大模型研究员
《ClickHouse性能之巅》作者,资深大数据专家和架构师,滴普科技(数据智能基础软件独角兽)合伙人,从0到1地建设了首支滴普科技的数据技术团队,构建了滴普科技的数据智能技术体系。
曾在DTCC、DataFun数据智能大会等多个会议上发表数据智能方向的演讲。
目前致力于领域大模型技术的工程化落地,帮助多家企业实现领域大模型在业务上的落地。
分享概述:
介绍ClickHouse在大模型RAG架构中的应用
分享6:《腾讯云TCHouse-C内核在Schema-less和数据实时更新的探索》
讲师:彭健
腾讯 腾讯云-云产品二部-ClickHouse Oteam PMC
在大数据领域深耕多年,现有就职于阿里巴巴和腾讯。现负责腾讯云TCHouse-C内核研发, 腾讯ClickHouse Oteam PMC。
分享概述:
介绍腾讯云TCHouse-C服务广泛应用于腾讯公司内部业务以及公有云业务。
分享腾讯云TCHouse-C内核中Schema-less和Upsert功能,以及设计与实现。
05
温馨提示
1、本次活动免费,由于场地有限,请及时报名,确保能签到入场。
2、报名的朋友们如果提供的email和手机号码无误,我们会在活动开始前一天发送短信和邮件确认。所以请确认自己填写的email地址无误。】
3、本活动欢迎大家带自己的同事和朋友一起参加,不过为了确保良好的听课环境,请尽可能提前为他们报名。
06
关于主办方
07 合作伙伴
08
本次活动独家报名平台