Skip to main content
  1. 论文/

DICOM如何支持大数据管理?在医学影像社区中的应用调查

·3656 words·8 mins
DICOM 大数据 数据管理 COVID-19 数据分析 医学影像 标准化 数据共享 互操作性 数据隐私
Table of Contents

✏️ Marco Aiello
✏️ Giuseppina Esposito
✏️ Giulio Pagliari
✏️ Pasquale Borrelli
✏️ Valentina Brancato
✏️ Marco Salvatore

要点总结
#

医学影像领域的数据量正在迅速增长,但缺乏标准化和隐私问题是阻碍大数据利用的主要障碍。 本研究旨在验证DICOM标准在医学影像研究中的实际应用情况,特别是其在隐私保护、图像分割和报告生成等高级功能中的使用。通过对100个公开医学影像数据库和10个常用医学影像软件工具的系统性分析,研究发现仅有不到三分之一的数据库使用DICOM格式记录有意义的信息,且大多数软件工具未能完全支持DICOM的高级功能。

研究结果表明,尽管DICOM标准具备支持大数据管理的潜力,但其在科研和临床实践中的应用仍不充分。 特别是在COVID-19疫情期间,仅有少数胸部CT数据集以DICOM格式发布。研究呼吁科研和技术社区进一步推广DICOM标准的使用,以促进数据共享和互操作性,推动大数据分析的实际发展。

关键要点
#

论文重要性
#

这项研究揭示了DICOM标准在医学影像大数据管理中的潜力与挑战。 随着医学影像数据的快速增长,标准化和隐私保护成为关键问题。DICOM标准能够有效支持数据共享和互操作性,但其在科研和临床实践中的应用仍需进一步推广。未来研究应关注如何提升软件工具对DICOM标准的支持,并推动其在更多医学影像数据库中的应用,以促进大数据分析的发展。


图表分析
#

放射工作流程图
#

🔼 该图表以流程图的形式展示了传统的放射学工作流程以及如何利用 DICOM 标签收集大数据分析所需的信息。整个流程从“患者/临床问题”开始,患者接受“影像扫描”,扫描结果以 DICOM 格式存储。然后,数据会经过两个主要路径:常规工作流程和大数据工作流程。在常规工作流程中,影像数据会被存储在 PACS 中,并用于生成“临床报告”。与此同时,在“临床报告”环节,也会产生“影像报告”,其中包含“分割”、“注释”、“测量”和“临床评论”等数据。在大数据工作流程中,DICOM 数据首先经过“去标识化”(DE-ID)处理,以保护患者隐私,然后转换为 “DICOM EXAM” 格式。此时,会产生两种关键的 DICOM 格式数据:“DICOM-SEG”(分割数据)和 “DICOM-SR”(结构化报告)。这些数据被收集到“影像数据库”中,为后续的“分析”提供数据基础。图中的蓝色箭头代表传统的放射学工作流程,绿色箭头则表示为大数据分析而收集数据的路径。此图明确了 DICOM 标准在影像数据管理和大数据分析中的关键作用,强调了其在数据采集、存储、处理和分析过程中的重要性。通过这种方式,将放射影像数据从传统的临床使用扩展到大数据分析领域,有助于推动医学研究和临床实践的进步。此图说明了如何利用结构化数据实现对放射影像数据的进一步分析和利用。

更多图表分析

DICOM SR模板结构
#

🔼 该图展示了 DICOM 结构化报告(SR)中测量报告模板(模板 ID 1500)及其子模板的结构。这是一个树状结构图,用于表示如何组织和关联 DICOM SR 中的各种信息元素。图中主要分为几个层次,顶层是 TID 1500 “测量报告”,它是一个容器,包含了整个测量报告的结构。下一层是一些主要的上下文信息,例如观察者上下文(TID 1001 和 TID 1002)、程序上下文(TID 1005)和主题上下文(TID 1006)。这些上下文信息提供了关于报告生成环境和所描述对象的基本信息。接下来是更具体的测量信息,包括图像库(TID 1600)、ROI 测量(TID 1419 和 TID 1411)和测量组(TID 1501)。这些部分详细描述了测量的来源、位置和方法。每个测量部分都可能包含进一步的子模板,例如时间点上下文(TID 1502)、测量属性(TID 310)和引述(TID 1000)。这些子模板提供了测量数据的具体细节,例如测量时间、单位、算法和相关图像。图中的不同 TID 代表不同的模板 ID,每个模板都有特定的含义和结构。整个结构的设计目标是实现医学影像数据的标准化和互操作性,使得不同系统可以理解和共享这些数据。通过这种层次化的结构,可以清晰地表达测量报告的各种方面,包括上下文、测量值和相关信息,为医学影像分析和临床决策提供有力支持。这幅图阐述了 DICOM SR 标准在医学成像中如何促进数据结构化的重要性,并展示了其在临床报告和研究中的应用潜力。图中的层次结构设计旨在确保报告的完整性、准确性和可读性,并促进数据在不同系统之间的无缝共享和分析。这种标准化的数据表达方式对于医学图像处理、人工智能应用和大数据分析具有重要意义。

数据库筛选流程图
#

🔼 该流程图详细描述了医学影像数据库的评估和筛选过程。初始阶段,通过伪系统性网络搜索识别出210个数据库。第一步筛选后,保留了100个包含DICOM原始数据的数据库。第一步筛选排除了110个数据库,原因包括数据非DICOM格式、非人类受试者数据、幻影数据、私有数据库以及需要特殊申请的数据库。第二步筛选进一步将数据库数量减少到83个,这些数据库除了DICOM原始数据外,还包含其他附加信息(但不一定是以DICOM格式)。这些附加信息包括临床信息、注释/分割信息和报告。第二步筛选排除了17个数据库,因为它们没有包含除DICOM图像之外的附加信息。第三步筛选聚焦于那些以DICOM标准格式(DICOM-SEG或DICOM-SR)提供附加信息的数据库。最终,筛选出34个数据库,其中10个包含DICOM-SEG格式数据,7个包含DICOM-SR格式数据,17个同时包含DICOM-SEG和DICOM-SR格式数据。这个筛选过程突显了在医学影像大数据管理中,DICOM标准的应用现状和挑战,尤其是DICOM-SEG(用于分割信息)和DICOM-SR(用于结构化报告)的实际使用情况。流程图清晰地展示了从大量初始数据到最终筛选结果的逐步过程,体现了研究中对数据质量和标准化的严格要求。该图说明了尽管DICOM在医学影像领域有广泛的应用,但其高级功能如DICOM-SEG和DICOM-SR的实际使用仍然相对有限,这暗示了未来需要进一步推动这些标准的采用。

深度解读
#

DICOM潜力
#

DICOM标准在医学影像数据管理中展现了巨大的潜力,尤其是在大数据分析领域。DICOM不仅支持影像数据的存储和传输,还能够整合多种元数据,如隐私保护、图像分割和结构化报告。然而,尽管DICOM具备这些高级功能,研究发现,仅有不到三分之一的公开数据库充分利用了DICOM格式来记录有意义的信息。特别是在COVID-19疫情期间,尽管DICOM是临床影像采集的标准格式,但仅有少数数据集以DICOM格式发布。这表明,尽管DICOM在理论上能够支持大数据管理,但在实际应用中,科研和临床社区仍需进一步推广其使用,以促进数据共享和互操作性。

软件支持不足
#

尽管DICOM标准具备强大的功能,但现有的医学影像软件对其高级功能的支持仍然不足。研究发现,大多数软件工具无法完全支持DICOM的隐私保护、图像分割和结构化报告等高级功能。例如,仅有少数软件能够读取DICOM-SEG(图像分割)和DICOM-SR(结构化报告)格式的数据,而几乎没有软件能够写入这些格式。这种软件支持的不足限制了研究人员和临床医生创建和共享符合DICOM标准的数据集的能力。未来的研究应着重开发更多支持DICOM高级功能的软件工具,以促进大数据分析的发展

COVID-19数据共享
#

在COVID-19疫情期间,医学影像数据的共享变得尤为重要,尤其是在开发基于人工智能的诊断工具时。研究发现,尽管DICOM是临床影像采集的标准格式,但在COVID-19相关的胸部CT数据共享中,仅有少数数据集以DICOM格式发布。大多数数据集使用了非医学领域的图像格式,如PNG和TIFF,这可能是由于紧急情况下缺乏合适的工具来管理和共享DICOM数据。这表明,在未来的公共卫生危机中,推广DICOM标准的使用将有助于更高效地共享和分析医学影像数据

结构化报告
#

结构化报告(SR)在医学影像数据管理中具有重要作用,尤其是在临床决策和大数据分析中。DICOM-SR标准能够将影像数据与临床报告、定量成像生物标志物等信息整合在一起,从而为AI算法提供支持。然而,研究发现,仅有少数数据库和软件工具支持DICOM-SR格式。尽管DICOM-SR在理论上能够提高数据的一致性和可重用性,但其在临床实践中的实施仍然面临挑战,如传统报告方式的惯性、模板报告的潜在错误等。未来的研究应着重解决这些实施障碍,以推动结构化报告在医学影像中的广泛应用

未来研究方向
#

未来的研究应着重解决DICOM标准在实际应用中的局限性,特别是在大数据分析和AI算法中的应用。首先,需要开发更多支持DICOM高级功能的软件工具,以促进数据共享和分析。其次,应进一步推广DICOM-SEG和DICOM-SR格式的使用,以提高数据的一致性和可重用性。此外,在公共卫生危机中,如COVID-19疫情,应优先使用DICOM格式来共享医学影像数据,以支持快速开发和验证AI诊断工具。最后,未来的研究还应探索如何将DICOM与其他标准(如BIDS)结合,以支持多模态数据的整合和分析。

完整论文
#