更新README

This commit is contained in:
2026-01-13 22:55:43 +08:00
parent e3db1b57a0
commit c3d7753add
5 changed files with 177 additions and 896 deletions

299
README.md
View File

@@ -1,150 +1,205 @@
# 跨平台虚拟显示协作系统技术方案
# DisplayFlow - 跨设备无缝互联协作平台
## 1. 项目概述
本项目旨在构建一个高性能、高灵活性的虚拟显示协作系统。其核心目标是打破传统副屏方案在平台、角色和连接方式上的限制,实现任何设备、任何角色、任何网络下的无缝显示扩展与协作。
本项目旨在构建一个高性能、高灵活性的**跨设备无缝互联协作平台**。其核心目标是打破传统设备间的物理与系统边界,不仅实现屏幕的自由扩展,更打通**显示、控制、数据与外设**的隔阂,让多台设备像一个整体一样协同工作。
**核心愿景**:打造一个"显示即服务"的通用平台,让显示资源能够在设备间自由流动。
**核心愿景**:打造一个"无界协同"的通用生态,让显示、输入与数据资源能够在设备间自由流动。
## 2. 核心设计理念与突出优势
---
本方案摒弃了"主机-客户端"的固化思维,采用全新的"角色-平台-连接"解耦设计,从而实现三大核心优势
## 2. 核心设计理念与优势
### 2.1 真正跨平台:同一套核心代码支持所有目标平台
本方案摒弃了"主机-客户端"的固化思维,采用全新的"角色-平台-连接"解耦设计:
- **核心共享库Platform-Agnostic Core**将所有业务逻辑协议、会话管理、编解码、网络抽象封装为100%跨平台的C++核心库。平台相关代码(显示渲染、输入捕获)被严格隔离为薄薄的适配层。
### 2.1 真正跨平台
- **核心共享库Platform-Agnostic Core**将所有业务逻辑协议、会话管理、编解码、网络抽象封装为100%跨平台的C++核心库。
- **技术实现**CMake统一构建Android NDK / Windows MSVC 条件编译。核心算法、协议在所有平台间完全一致。
- **受益**一次开发多平台部署Android, Windows, 规划中: Linux, macOS
- **技术实现**使用CMake作为统一的构建系统通过条件编译链接不同的平台适配层。核心算法、数据结构和通信协议在所有平台间完全一致确保行为统一极大降低开发和维护成本。
### 2.2 角色灵活
系统内置三种基础角色,设备可动态切换:
1. **主机Host**提供显示内容Android平板共享屏幕
2. **客户端Client**接收并显示内容PC将平板作为副屏
3. **对等端Peer**:同时作为主机和客户端(如:双人互动画板)。
- **受益**一次开发多平台部署。目前支持Android、Windows未来可快速扩展至Linux、macOS乃至嵌入式系统。
### 2.3 连接通用
- **局域网优先**USB RNDIS极低延迟、Wi-Fi便捷
- **互联网穿透**:集成 STUN/TURN/ICE 协议,实现 NAT 穿透,支持公网远程协作。
- **智能切换**NetworkManager 自动探测并选择最佳链路RNDIS > Wi-Fi > Relay
### 2.2 角色灵活:任何设备可动态充当任何角色
---
- **角色抽象Role Agnostic**:系统内置三种基础角色,设备可动态切换或同时兼任:
1. **主机Host**提供显示内容来源。示例Android平板共享屏幕。
2. **客户端Client**接收并显示内容。示例Windows电脑将平板屏幕作为副屏。
3. **对等端Peer**:同时作为主机和客户端,实现双向屏幕共享。示例:两个安卓设备互作副屏。
## 3. 全景功能规划 (Feature List)
- **技术实现**通过RoleManager进行动态角色管理和切换。会话协议中携带角色信息使通信双方能正确理解数据流方向。
### 3.1 核心投屏体验
- [x] **Windows 投屏到 Android**: 将 Android 平板/手机作为 Windows 的扩展副屏或镜像屏。
- [ ] **Android 投屏到 Windows**: 将 Android 屏幕画面实时投射到 Windows 电脑。
- [ ] **Android 投屏到 Android**: 两台移动设备间的屏幕共享与互动。
- **受益**:应用场景极大丰富,从简单的副屏扩展到复杂的多设备协作演示、双向画板等。
### 3.2 高级交互功能
- [ ] **反向触控**: 在 Android 端触摸屏幕,控制 Windows 的鼠标光标(支持多点触控映射)。
- [ ] **反向键鼠**: 在 Windows 端使用键盘鼠标,操作 Android 设备界面。
- [ ] **剪贴板同步**: 跨设备实时的文本/图片剪贴板共享。
- [ ] **音频流传输**: 系统声音随视频画面同步传输(支持 WASAPI Loopback
### 2.3 连接通用:支持局域网和互联网连接
### 3.3 生产力扩展
- [ ] **双向文件传输**: 支持拖拽发送文件,断点续传。
- [ ] **摄像头投屏**: 将 Android 手机摄像头作为 Windows 的高清网络摄像头。
- [ ] **虚拟扩展屏驱动**: 基于 IddCx 的虚拟显示器驱动,非镜像模式,真正的第二屏幕。
- **网络抽象层Network Agnostic**:设计统一的网络接口,自动选择或同时管理多种连接方式。
- **局域网连接**(优先使用):
- **USB RNDIS**:优先使用,提供近似有线的高带宽、低延迟体验
- **Wi-Fi 局域网**:提供无线便利性,支持一对多广播
- **有线以太网**:为台式机等设备提供稳定连接。
- **互联网连接**(通过 NAT 穿透):
- **STUN**NAT 类型检测和公网 IP 发现,支持公网直连。
- **TURN**:中继服务器支持,当直连失败时自动切换。
- **ICE 协议**:自动选择最佳连接路径(局域网 > 公网直连 > TURN 中继)。
### 3.4 网络与连接
- [ ] **mDNS 设备发现**: 局域网内自动发现可连接设备,无需手动输入 IP。
- [ ] **USB 有线连接**: 支持 USB RNDIS 模式,实现 <30ms 的超低延迟。
- [ ] **远程连接**: 支持跨广域网连接,在家连接公司电脑
- **技术实现**NetworkManager负责探测可用连接根据性能延迟、带宽自动优选或负载均衡。集成 ICE 协议实现 NAT 穿透,支持局域网和互联网无缝切换。应用层无需关心底层连接方式。
---
- **受益**:用户无需手动配置网络,系统自动选择最佳路径。支持跨网络、跨地域的设备连接,突破局域网限制,实现真正的远程协作。
### 2.4 扩展性强:轻松支持新设备类型与未来场景
- **模块化架构**:核心、平台、角色三大模块界限清晰,通过标准接口通信。
- **易于扩展**
- **新平台**实现对应的Platform Adapter显示、输入即可接入。
- **新角色**:在角色模型中定义新角色类型及其行为。
- **新功能**如AR/VR流传输可在协议中增加新的数据帧类型无需重构。
- **受益**:技术生命周期长,能快速适应未来新的硬件和设备形态。
## 3. 系统架构设计
### 3.1 软件架构图
## 4. 系统与工程架构
### 4.1 逻辑架构图
```
[ 应用层 ]
|
[ 角色层 (Role Layer) ] <- Host, Client, Peer 角色实现
|
[ 平台适配层 (Platform Adapter) ] <- Android显示捕获 / Windows DirectX渲染
|
[ 核心层 (Core Layer) ] <- 会话管理、协议、编解码、网络抽象 (100%跨平台)
|
[ 传输层 (Transport Layer) ] <- 局域网RNDIS/USB、Wi-Fi、以太网、互联网STUN/TURN/ICE
[ 应用层 (Qt/Kotlin) ]
|
[ 角色层 (Host/Client/Peer) ]
|
[ 平台适配层 (Platform Adapter) ] <-> (DXGI, MediaCodec, Camera2, IDD)
|
[ 核心层 (Core Shared Lib) ] <-> (Session, Protocol, Codec Interface)
|
[ 传输层 (Transport) ] <-> (UDP/TCP, ICE, WiFi/USB)
```
### 3.2 核心模块说明
1. **核心共享库Core**:包含整个系统的"大脑",完全跨平台。
- **会话管理**:创建、维护、销毁显示会话,支持一对多。
- **通用协议**基于Google FlatBuffers的跨平台序列化定义视频帧、输入事件等。
- **编解码器**支持H.264(硬件加速)/VP8软件/MJPEG等多种编解码器自适应选择。
- **网络抽象**统一管理RNDIS、WiFi等局域网连接以及STUN/TURN/ICE互联网连接提供可靠UDP传输。
2. **平台适配层Platforms**:各平台特有功能的薄封装。
- **Android**通过MediaProjection捕获屏幕ImageReader获取帧处理触摸输入。
- **Windows**使用DirectX进行高效渲染通过IddCx驱动框架实现真虚拟显示器处理键鼠输入。
3. **角色层Roles**:实现不同的协作模式。
- **主机角色**:负责屏幕捕获、编码、发送。
- **客户端角色**:负责接收、解码、渲染。
- **对等角色**:同时运行主机和客户端逻辑。
## 4. 典型应用场景
**场景一高效办公Android -> Windows**
- **描述**用户通过USB RNDIS将安卓平板连接至Windows电脑。
- **角色**Android设备作为主机HostWindows电脑作为客户端Client
- **价值**:平板屏幕变为电脑的低延迟副屏,用于扩展显示代码文档、聊天工具,提升桌面工作效率。
**场景二:会议演示(一对多广播)**
- **描述**讲者的安卓平板通过Wi-Fi将屏幕内容广播到会议室的多台设备。
- **角色**Android设备作为主机Host多台Windows电脑/安卓电视/平板作为客户端Client
- **价值**:无需线缆,即可实现一人屏幕、多人同步观看,适用于教学、培训和会议。
**场景三移动协作Android <-> Android对等模式**
- **描述**两名设计师的安卓平板通过Wi-Fi建立对等Peer 会话。
- **角色**两台Android设备均作为对等端Peer即同时兼任主机和客户端。
- **价值**:每人的平板上同时显示自己和对方的屏幕,实现真正的双向实时画板协作,创意无缝对接。
**场景四移动协作Android -> Android主从模式**
- **描述**:用户将手中的安卓手机(高性能)屏幕,扩展至另一台安卓平板(大屏幕)上显示。
- **角色**安卓手机作为主机Host安卓平板作为客户端Client
- **价值**充分发挥设备特性。用户可在手机上进行私密操作如游戏、使用特定APP而将主画面投送至平板大屏上进行展示或共享兼顾隐私与分享需求。这充分体现了角色的灵活性——安卓设备可根据需求自由扮演主机或客户端的角色。
**场景五:远程协作(跨网络、跨地域)**
- **描述**:用户在家中通过互联网连接到办公室的 Windows 电脑,实现远程显示扩展。
- **角色**:办公室 Windows 电脑作为主机Host家中设备作为客户端Client
- **连接方式**:通过 STUN/TURN 服务器实现 NAT 穿透,自动选择最佳连接路径。
- **价值**:突破局域网限制,支持跨网络、跨地域的设备连接。无论设备在哪里,只要有互联网连接,就能实现无缝显示协作。适用于远程办公、技术支持、远程演示等场景。
## 5. 技术规格与指标
- **支持平台**Android 5.0+ Windows 10/11
- **最大分辨率**4K依赖设备性能
- **最大帧率**60 FPS
- **端到端延迟**< 30ms USB RNDIS模式下
- **最大客户端数量**理论上无限制实践中受网络带宽和主机性能约束建议≤20
## 6. Git仓库结构建议
### 4.2 工程目录结构
```
DisplayFlow/
├── core/ # 跨平台核心库
├── platforms/
├── android/ # Android平台实现
│ └── windows/ # Windows平台实现
├── docs/ # 文档
├── prototypes/ # 原型和测试代码
└── tools/ # 开发工具脚本
├── CMakeLists.txt # 根构建脚本 (统一管理多平台)
├── README.md # 本文档
├── core/ # [核心库] 100% 跨平台业务逻辑
│ ├── include/displayflow/core/
│ │ ├── common/ # 基础类型 (types.h, constants.h)
│ │ ├── network/ # 网络抽象 (NetworkManager, NAT Traversal)
│ │ ├── protocol/ # 协议定义 (FlatBuffers Schema)
│ │ ├── session/ # 会话管理 (Host/Client Session)
│ │ ├── codec/ # 编解码接口抽象
│ │ ├── role/ # 角色状态机 (Host/Client/Peer)
│ │ ├── file_transfer/ # 文件传输逻辑
│ │ └── utils/ # 日志、工具类
│ └── src/ # 核心库实现 (.cpp)
├── platforms/ # [适配层] 平台特定实现
│ ├── android/
│ │ ├── include/ # JNI 接口, MediaCodec 封装
│ │ └── src/ # 屏幕捕获, 音频采集, Touch 注入
│ └── windows/
│ ├── include/ # DXGI, Media Foundation, IDD 封装
│ └── src/ # 鼠标键盘注入, 虚拟显示驱动桥接
├── demo/ # [验证原型] 快速验证 Demo
│ ├── android_receiver/ # Android 接收端 App (Kotlin + C++)
│ ├── windows_sender/ # Windows 发送端 App (C++)
│ └── windows_driver/ # IDD 虚拟显示驱动原型
├── docs/ # 设计文档
├── tests/ # 单元测试
└── tools/ # 辅助脚本
```
## 7. 技术栈
完全由C++实现
### 4.3 核心模块职责
* **Core (C++ Shared Lib)**: 整个系统的“大脑”。处理握手、协议解析、分包重组、状态管理。它不知道自己运行在 Windows 还是 Android 上,只通过接口与外部交互。
* **Platforms (Adapter)**: 系统的“手脚”。
* **Android**: 负责调用 `MediaProjection` 抓屏,`MediaCodec` 解码,`InputManager` 注入触摸。
* **Windows**: 负责调用 `DXGI` 抓屏,`SendInput` 注入键鼠,`IddCx` 创建虚拟屏。
## 8. 总结
---
本方案通过真正跨平台的核心设计、动态角色分配和多连接方式抽象,突破了现有副屏方案的局限性。它不仅仅是一个"副屏工具",更是一个为未来多设备协作世界打造的、极具扩展性的通用显示协作平台。该架构确保了项目在性能、灵活性和可持续性上的领先优势。
## 5. 技术栈与选型
### 5.1 核心依赖
- **语言**: C++ 17 (Core), Kotlin (Android UI), C++/WinRT (Windows UI)
- **构建系统**: CMake 3.15+
- **序列化**: Google FlatBuffers (高性能、零拷贝)
- **网络**: BSD Sockets (UDP/TCP), STUN/TURN/ICE (NAT穿透)
### 5.2 编解码方案
- **视频编码**:
- Windows: FFmpeg (x264) / Media Foundation (H.264 Hardware)
- Android: AMediaCodec (NDK Hardware Encoder)
- **视频解码**:
- Windows: FFmpeg / D3D11VA
- Android: AMediaCodec (NDK Hardware Decoder) -> ANativeWindow
### 5.3 平台特定技术
- **Windows**: Desktop Duplication API (DXGI), Indirect Display Driver (IddCx), SendInput API.
- **Android**: MediaProjection API, AImageReader, Android NDK, AccessibilityService (用于全局触控注入).
---
## 6. 开发计划与里程碑
### 阶段一:核心架构搭建 (Foundation Phase) - [已完成]
**目标**:建立跨平台核心库的基础架构和构建系统。
- [x] 配置 CMake 作为统一构建系统。
- [x] 设置跨平台编译配置 (Android NDK, Windows MSVC)。
- [x] 建立核心库目录结构。
- [x] 实现基础 UDP 网络发送与接收 Demo。
### 阶段二Windows 发送端实现 (Windows Sender) - [已完成]
**目标**:实现高性能 Windows 屏幕抓取与编码。
- [x] **DXGI Capture**: 实现 Desktop Duplication API 零拷贝抓屏。
- [x] **FFmpeg Encoding**: 集成 x264配置 `zerolatency` 低延迟编码。
- [x] **UDP Transport**: 实现自定义分片协议发送。
- [x] **IDD Simulation**: 验证虚拟显示驱动的管道连通性。
### 阶段三Android 接收端实现 (Android Receiver) - [进行中]
**目标**:实现 Android 端的高性能接收与渲染。
- [ ] **JNI 桥接**: 建立 Java (Surface) 与 C++ Native 层的通道。
- [ ] **Network Layer**: 移植 Demo 中的 `UdpReceiver` 到 Android NDK 环境。
- [ ] **Decoder**: 实现 `AMediaCodec` (NDK) H.264 硬解码。
- [ ] **Renderer**: 将解码后的 Buffer 直接渲染到 `ANativeWindow` (Surface)。
- [ ] **Latency Optimization**: 调优 Jitter Buffer目标端到端延迟 < 50ms。
### 阶段四:高级功能迭代 (Advanced Features) - [规划中]
**优先级 P0 (核心体验)**
1. **反向控制**: Android 捕获 Touch 事件 -> TCP -> Windows `SendInput`
2. **设备发现**: 集成 mDNS (Bonjour/NsdManager),局域网自动发现。
**优先级 P1 (生产力工具)**
1. **文件传输**: TCP 通道,拖拽发送,断点续传。
2. **剪贴板同步**: 监听系统剪贴板变化,差异同步。
**优先级 P2 (扩展能力)**
1. **虚拟扩展屏**: IddCx 驱动产品化,实现真正的扩展屏模式。
2. **音频同步**: WASAPI Loopback 捕获 -> Opus 编码 -> 传输 -> 解码播放。
3. **摄像头投屏**: Android Camera2 API 采集 -> 视频流传输 -> Windows 虚拟摄像头驱动。
---
## 7. 典型应用场景
1. **高效办公 (Win + Android)**: 平板作为电脑副屏,浏览文档、即时通讯。
2. **会议演示 (One-to-Many)**: 一台设备讲演,多台设备实时同步观看。
3. **远程协助 (Internet)**: 远程控制家中/公司电脑,进行维护或操作。
4. **移动协作 (Android <-> Android)**: 双人画板,创意实时同步。
---
## 8. 技术规格
- **支持平台**Android 5.0+, Windows 10/11
- **分辨率**:支持 720p, 1080p, 2K, 4K (自适应)
- **帧率**30/60 FPS
- **延迟**< 30ms (USB RNDIS), < 60ms (Wi-Fi 5G)
- **并发数**:支持 1 对多广播 (取决于 Host 带宽)
---
## 9. 风险与应对
1. **网络抖动**:
* *应对*: 引入 FEC (前向纠错) 和 NACK 重传机制Jitter Buffer 自适应调整。
2. **Android 碎片化**:
* *应对*: 优先使用标准 NDK API (AMediaCodec, AImageReader);建立机型白名单。
3. **驱动签名**:
* *应对*: 开发阶段使用测试签名模式;发布时申请微软 WHQL 认证或 EV 证书。