架构
定位
提供企业级(高效、稳定、安全、低成本、产品化)的文件分发与管理服务,并成为在该领域的云原生最佳实践与标准解决方案。
解决的问题
架构设计缺陷: 现有架构很难满足日益增长的文件分发业务需要,在稳定性、效率以及安全性等方面逐渐暴露出不足,并受到越来越多的挑战
价值渗透不足: 当前只支持 HTTP 回源协议,针对其他类型的存储(HDFS、各云厂商的存储服务、Maven、YUM 等等)缺乏适配
分发模式单一: 目前只支持主动拉取模式,缺少主动推送以及主动同步能力
产品化能力缺失: 没有提供完善的控制台功能,比如分发任务管理与管控、数据大盘、多租户以及权限控制等等
核心能力
- 通过统一的回源适配层及实现支持各种不同类型存储(HDFS、各云厂商的存储服务、Maven、YUM 等等)的 P2P 文件分发能力
- 支持更多的分发模式: 主动拉取、主动推送、实时同步、远程复制、自动预热、跨云传输等等
- 系统之间分离解耦,调度与 CDN 插件化,且支持按需部署,可轻可重,可内可外,灵活满足不同场景的实际需要
- 基于 grpc 全新设计的 P2P 协议框架,效率及稳定性更佳
- 支持加密传输、基于账号的传输鉴权与限流、多租户隔离机制
- 支持更高效的 IO 方式: 多线程 IO、内存映射、DMA 等
- 支持动态压缩、内存文件系统以及更高效的调度算法,提升分发效率
- 客户端通过 C/S 模式支持第三方软件原生集成蜻蜓的 P2P 能力
- 产品化能力: 支持文件上传、各种分发模式的任务管理、数据视图以及全局管控等功能
- 内外一套,核心特性相互共享,非通用特性各自扩展
- 与生态进一步集成: Harbor、Nydus(镜像按需下载解决方案)、各云厂商仓库服务等
架构设计
子系统功能
Manager
- 动态配置管理
- 数据大盘 & 带宽计量
- 文件上传 & 分发管理与管控
- 文件同步管理
- 账号 & 权限控制
- 订阅 & 通知
- 多租户管理
- 命令通道服务(通道合一)
Scheduler
- 基于多维度的 P2P 调度策略
- 智能化调度算法(高级)
- 调度结果可量化对比以及支持 A/B Testing
- 调度策略插件化以及 CDN 子系统插件化
- 元信息下发管道
- 客户端下载结果和回源结果统计以及与监控服务的对接
CDN
- 多源适配能力,包括目录下载和 Range 下载功能
- DMA 读写
- 回源中转
- 分发预热
- 动态压缩
- 存储管理(种子存放、磁盘清理、块级存储)
- 内存文件系统
- 安全传输(对称加密、完整性校验等)
- 存储介质插件化
Dfdaemon
- 多源适配能力,包括目录下载和 Range 下载功能
- 高效 IO 机制
- 多下载任务的 IO 调度(高 IO 吞吐量)
- 减少文件读写次数:改进临时文件存放方式、文件完整性校验改进
- DMA 读写
- 流式传输
- 客户端下载 Proxy 能力(http & https)
- 单服务进程启动(CS 模式)以及常驻和非常驻模式
- 失败回源处理
- 本地缓存能力(客户端 seeder 模式)
- 客户端优雅升级与部署方案
- 命令执行
Framework
- 高可用、高性能、易集成
- 一致性 Hash 算法选主
- 客户端连接管理