云AI平台架构提升方案.pptx
《云AI平台架构提升方案.pptx》由会员分享,可在线阅读,更多相关《云AI平台架构提升方案.pptx(33页珍藏版)》请在悟道方案网上搜索。
1、云AI平台架构提升方案,语音云从0到1的在线服务量增长,什么是语音云: 依托于语音及其他人机交互能力, 将用户意图与应用行为自然便捷 地关联起来,从而满足用户多样 化交互需求的服务通道 让语音像水电一样方便接入 语音云流量的特点: 流式会话 通常一次服务中语音25秒 为了实时性要求,一次服务中的 语音大概通过100次请求响应完成,第一代服务的核心架构,和常规互联网服务架构不一样的地方就 是为了管理高密集计算引擎而做的负载 均衡组件,语音数据流图,应用,SDK,接入负载,业务,引擎,支,/ 数 据,服,启 动,语音交互,初始化,接入选择,发起业务,流式音频交互,登录服务,加载资源,识别处理,务处
2、理,识别结果 语义&业,业务加载 参数更新 引擎选择 创建实例,数据预处理,结果缓存 多引擎调度 业务处理,结果呈现,数据收集,更新下发,撑 策略配置,务 业务配置,资源更新,高密集计算引擎调度架构演进,业务-节点1,业务-节点2,ASR引擎 节点1,ASR引擎 节点2,Round-Robin,计算能力不一样?Weighted Round-Robin,如何做过载保护?如何熔断?,5,-50,0,50,100,150,200,250,300,计算密集型应用的性能指标,050100150200250,Throughput 15000 10000 5000 0,Concurrent, , ,无法轻松
3、的定出指标,性能定标测试, ,如何精细化调度?,计算引擎负载均衡, , , ,业务-节点1,ASR引擎 节点1,载均衡 节点,1.获取可用计 算引擎节点,2.调用计算引擎,0.实时上报当前并 发量以及警戒水位,ASR引擎 节点1,ASR引擎 节点1,ASR引擎 节点1,ASR引擎 节点N,负,负 载均衡 节点,负载均衡 节点,用户级个性化定制, , ,负载均衡节 点,1.获取uid-123的可用 计算引擎节点,2.调用计算引擎,业务-节点 1,0.预热uid-123的资源,ASR引擎 节点1,ASR引擎 节点2,ASR引擎 节点3,DB,问题,极大增加了调度的复杂性 某个分段都是热点用户 无法
4、很好的适配弹性伸缩的运 维体系,个性化调度的转机, ,大道至简,让调度更加纯粹 计算节点无明显状态,更好的适配弹性架构,将个性化资源做集中缓存方案,类CDN方案 子系统指标更加明确:并发、时延、成功率、缓 存命中率,1.调用计算引擎,业务-节点 1,ASR引擎 节点1,ASR引擎 节点2,ASR引擎 节点3,一级缓存,一级缓存,一级缓存,OSS,2.获取个性化资源,3.获取个性化资源,接入网关的演进, , , ,好用,穿透 性强,省流量,速度快,接入网关的演进, , ,client,upstream,nginx,http/2 - Http/1.1,Http/1.1 - http/2,这样的实现
5、支持不了Server Push,接入网关的演进, , , ,流量爆涨带来的质量问题, ,全链路日志, , ,日志跟踪2.0 基于Google Dapper原理,实现了调用 链的结构化描述,埋点的一些实践案例,日志埋点要细到什么程度才能让Boss有安全感? 万一是在发布会演示,玩砸了怎么办? 某日Boss在良好的4G网络下使用输入法,反馈慢,要求彻查 收到问题的第一反应就是网络的锅 经过日志链排查,确实有一次会话出现了一次慢响应,原因是某个数据报文到服务端慢了 通过大量的日志统计分析,显示当时所在基站下的接入成功率正常,排除是大范围接入问 通过对该基站的测试,发现确实有极低概率的丢包重传问题 为



- 温馨提示:
建议用WPS软件(.pptx、.docx)打开文档,少量文档使用Microsoft(.ppt、.doc)打开易出错。
- 配套讲稿:
如PPT文件的首页显示word图标打开文档,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ai 平台 架构 提升 晋升 方案
