当前位置:首页>HOS学院>技术前沿>Azure Kinect DK基础问答(上篇)

Azure Kinect DK基础问答(上篇)

作者:hosmba发布时间:2019-07-25 11:03:51来源:青亭网

着Azure Kinect DK在中国大陆地区的正式发货,我们收到了许多热心读者关于产品和技术的询问。今天我们为大家梳理和归类了这些问题,并且希望通过《Azure Kinect DK基础问答上下篇》的分享,让更多的读者更全面的了解Azure Kinect DK这款全新的产品。


01.png


目录


◉Azure Kinect DK基本介绍(上篇)

◉Azure Kinect DK 的SDK和API简介(上篇)

◉定价及购买渠道(上篇)

◉典型适用场景(下篇)

◉更多资源(下篇)

Azure Kinect DK基本介绍


问:Azure Kinect DK是一款什么样的产品?


Azure Kinect DK(如下简称Azure Kinect)是一款开发人员工具包和电脑外设,配有先进的人工智能(AI)传感器,可用于复杂的计算机视觉和语音模型。它将出色的深度传感器和空间麦克风阵列与视频摄像头和方向传感器相结合,即将多种模式、选项和SDK全部集成到一个小型设备中。


问:DK代表什么含义?


DK=Developer Kit, 是开发者工具包的缩写。当开发者拿到Azure Kinect DK后,需要首先进行相关的开发。


问:Azure Kinect 的目标用户是哪些?


Azure Kinect 是一款商用设备,因此它面向的是专业开发者和企业用户,而不是普通消费者。


问:请介绍一下Azure Kinect 的主要硬件配置?


Azure Kinect 将多款业界领先的人工智能传感器集于一身,其中包含100万像素ToF深度摄像头、1200万像素高清摄像头,7麦克风圆形阵列,和方向传感器(IMU)- 囊括了深度,视觉,声音和方向四大传感器类别,。而它的重量仅为440g,长度不到13厘米,厚度不到4厘米。


问:Azure Kinect 的深度传感器(ToF)有什么特色?


Azure Kinect 搭载了100万像素ToF深度摄像头,它在控制访问时可以选择宽或窄两种FOV视野,这样可以更好的根据不同场景需求优化应用,在实际空间内获取的数据将会更为精准。宽窄FOV识别的有效范围可以分别达到2.88米宽和5.46米长。当我们利用深度摄像头进行房间环境识别的时候,ToF的技术能够近乎实时的捕捉到周围环境信息,并基于扫描到的深度数据,将捕捉到的人或物以深度摄像画面和三维点云效果来表现。基于对环境的实时扫描,我们可以用Azure Kinect Viewer切换到不同角度进行轮廓观察,并且还可以通过缩小和放大来观测这些空间数据的细节画面。


02.png


图片摘自Azure Kinect 技术文档


问:Azure Kinect 的高清摄像头主要作用是什么?


Azure Kinect的1200万像素高清摄像头可以支持输出4K的高清画质。它在控制访问时,可以鉴别出物体的边界范围,以此来辅助深度摄像头获得物体的尺寸数据。通过控制图像分辨率和时间戳等相机帧元数据,我们可以同步深度摄像头和高清摄像头之间的相机流和配置延迟,进而使深度数据更为准确。


问:什么是Azure Kinect 的声音和方向传感器?


Azure Kinect 配备7麦克风阵列,用于敏锐的360度环绕空间声音的捕捉和收集。Azure Kinect 还可以通过对惯性测量单元IMU的控制和自定义调优,精确地计算三轴信息加速度来确定空间坐标位置。


问:Azure Kinect 可以和Xbox 相连接吗?


Azure Kinect 不是Xbox的配件,所以不能与Xbox搭配使用。


问:Azure Kinect 能在户外使用吗?


Azure Kinect 是一款适用于室内的产品。我们建议设备使用时的周边环境温度为10-25摄氏度,这样可以保证设备运行状态的稳定性和可靠性。


问:我能同时使用多个 Azure Kinect 吗?


可以,Azure Kinect 既可以单独与PC相连,也可以多个设备同步,从而更加精准的捕捉3D环境。


问:Azure Kinect 只能放在桌面上使用吗?


不是的,我们提供了多种安装方式,更好适配您的使用场景。


Azure Kinect 的SDK和API简介


问:微软会提供哪些SDK和API来帮助开发者更好使用Azure Kinect?


微软不仅为开发者提供相关的传感器SDK和身体跟踪SDK,还通过Azure认知服务中的视觉和语音API,更好的帮助开发者将业务想法付诸实践。大家可以通过下图了解一下它们是如何协同工作的:


03.png


问:可否介绍下传感器SDK和身体追踪SDK?


传感器SDK可以获取深度摄像头,高清摄像头,加速度计及陀螺仪等传感器的原始数据,并可以将这些数据进行校准与同步。开始使用Azure Kinect 之前,请将您的设备连接至装有Windows 或者Linux系统的电脑并下载传感器SDK。您可以通过 https://docs.microsoft.com/zh-cn/azure/Kinect-dk/sensor-sdk-download下载传感器SDK。


身体跟踪SDK将于2019年秋季正式推出,目前公共预览版已经开放下载。身体跟踪SDK可以允许Azure Kinect 以3D的方式追踪移动或处于固定位置的人体。身体跟踪SDK可以提供实例分割,2D关键点以及观察到的或者估算的3D关节和关键点等功能,从而获得完整清晰和唯一性鉴别的多骨骼身体跟踪能力,继而能够对动作进行准确追踪,同时还能识别画面中的多个物体。您可以通过https://docs.microsoft.com/zh-cn/azure/Kinect-dk/body-sdk-download下载身体跟踪SDK。

问:使用传感器SDK对系统的要求是什么?


使用传感器SDK的计算机系统需要为第 7 代Intel® CoreTM i3 处理器(双核 2.4GHz 包含HD620 GPU 或更快)的 Windows 10® 或者Ubuntu 18.04 LTS计算机、USB 3.0 端口、4GB内存。不支持 Windows 10 S 模式。此外,身体跟踪SDK等其他功能可能需要更高级的 PC 硬件。


问:请描述一下Azure Kinect 与Azure 视觉和语音API结合后的能力?


视觉API


Azure Kinect 搭载了100万像素深度摄像头和1200万像素高清摄像头,可以对物体,场景和动作进行识别。当它结合本地计算和Azure认知服务后,就能够对人脸进行准确识别;同时借助身体跟踪和动作识别的SDK,Azure Kinect能对关键人物进行快速定位辨别。此外Azure认知服务还能识别目标人物的情绪变化。视觉API功能不但可以追踪物体和人物,凭借Azure认知服务图像识别功能,通过OCR可以将文本和手写体内容进行准确识别,让设备和应用"看"懂这个世界。


语音API


Azure Kinect 的圆形麦克风阵列及传感器可以实时收集外界的声音,并通过Azure认知服务的语音识别功能实时处理翻译成文字。此外,通过语音识别API,根据声音的关键特征,我们能够较为准确识别说话人的身份信息,如果同时运用Azure Kinect 的方向传感器信息,我们可以进一步锁定说话人的位置。


问:如何开始Azure Kinect与Azure 认知服务结合的第一步?


您可以将Azure Kinect与Azure进行轻松集成,进一步推进项目。您可以将Azure Kinect 上的高级传感器与 Azure认知服务相结合,开发更准确的视觉和语音模型,并使用Azure 机器学习来训练模型。请使用 Azure IoT Edge https://azure.microsoft.com/zh-cn/services/iot-edge/管理已连接到 Azure Kinect的电脑。您可以通过点击 https://azure.microsoft.com/zh-cn/services/cognitive-services/来了解更多Azure 认知服务。


问:Azure Kinect Viewer 是什么?


Azure Kinect Viewer 可以用来可视化设的备数据流,可以检验传感器的工作状态,协助设备定位,测试摄像头设置,读取设备配置等。Azure Kinect Viewer是开源的,可以用作如何使用API的示例。更多详情请参考https://docs.microsoft.com/en-us/azure/Kinect-dk/azure-kinect-viewer。


问:如何获得Azure账户(全球版)?


您可以登录https://www.microsoft.com/china/azure/选择“全球版Azure ”开始创建账户。


  环视天下声明:HOSSKY网站登载或转载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

技术前沿热点

服贸会