Categories: 未分類

Apache cTAKES

Apache_cTAKES

Apache cTAKES：臨床テキスト分析および知識抽出システムは、電子健康記録の非構造化テキストから臨床情報を抽出するオープンソースの自然言語処理（NLP）システムです。臨床ノートを処理し、臨床的に指定されたエンティティのタイプ（薬物、疾患/障害、徴候/症状、解剖学的部位および手順）を識別します。名前付きの各エンティティには、テキストスパン、オントロジーマッピングコード、コンテキスト（家族歴、現在、患者とは無関係）、および否定/否定されていない属性が Apache cTAKES 開発者
Apache Software Foundation
安定リリース
4.0.0 / 2017年4月25日 ; 4年前（2017-04-25）
リポジトリ
cTakesリポジトリ
で書かれている Java、Scala オペレーティング・システム
クロスプラットフォーム
タイプ
自然言語処理、バイオインフォマティクス、テキストマイニング、情報抽出
ライセンス
Apacheライセンス2.0
Webサイト
ctakes .apache .org
cTAKESは、UIMA非構造化情報管理アーキテクチャフレームワークとOpenNLP自然言語処理ツールキットを使用して構築されました。

コンテンツ
1 コンポーネント
2 歴史
3 も参照してください
4 参考文献
5 外部リンク

コンポーネント
cTAKESのコンポーネントは、臨床領域向けに特別にトレーニングされており、臨床意思決定支援システムや臨床研究で利用できる豊富な言語的および意味論的注釈を作成します。
これらのコンポーネントは次のとおりです。
名前付きセクション識別子
文境界検出器
ルールベースのトークナイザー
フォーマットされたリスト識別子
ノーマライザー
コンテキスト依存のトークナイザー
品詞タガー
句動詞チャンカー
辞書ルックアップアノテーター
コンテキストアノテーター
否定検出器
不確かさの検出器
被写体検出器
依存関係パーサー
患者の喫煙状況識別子
薬物言及アノテーター

歴史
cTAKESの開発は、2006年にメイヨークリニックで始まりました。GuerganaSavova博士とChristopher Chute博士が率いる開発チームには、医師、コンピューターサイエンティスト、ソフトウェアエンジニアが含まれていました。展開後、cTAKESはMayoの臨床データ管理インフラストラクチャの不可欠な部分となり、8000万を超える臨床ノートを処理しました。
2010年の初めにサボバ博士がボストンチルドレンズホスピタルに引っ越したとき、コア開発チームはそこにメンバーを含めるようになりました。その他の外部コラボレーションには次のものが
コロラド大学
ブランダイス大学
ピッツバーグ大学
カリフォルニア大学サンディエゴ校
このようなコラボレーションにより、cTAKESの機能は、時間的推論、臨床質問応答、臨床領域の共参照解決などの他の領域にまで拡張されました。
2010年に、cTAKESは、採択されたi2b2プログラムの中心的なコンポーネントであるSHARP領域4。
：2013年に、cTAKESはApacheのインキュベーター・プロジェクトとしての最初のリリースを発表しcTAKES 3.0。
2013年3月、cTAKESはApacheトップレベルプロジェクト（TLP）になりました。

も参照してくださいOpenNLP UIMA
電子健康記録
統一医療言語システム

参考文献
^ デネッケ、カースティン（2015-08-31）。「情報抽出のためのツールとリソース」。Health Web Science：ヘルスケアのためのソーシャルメディアデータ。スプリンガー。NS。 67。ISBN 978-3-319-20582-3 –Googleブックス経由。
^ ハリファ、アブドゥラマン; Meystre、Stéphane（2015-12-01）。「臨床ノートにおける心血管危険因子の同定のための既存の自然言語処理リソースの適応」。Journal of BiomedicalInformatics。2014 i2b2 / UTHealth共有タスクの議事録と臨床データの自然言語処理における課題に関するワークショップ。58（補足）：S128–S132。土井：10.1016 /j.jbi.2015.08.002。PMC 4983192。PMID 26318122。 ^ Khudairi、サリー（2017-04-25）。「ApacheSoftwareFoundationがApache®cTAKES™v4.0を発表」（プレスリリース）。フォレストヒル、メリーランド州：Apache SoftwareFoundation。グローブニュースワイヤー。
^ Savova、Guergana K; マザンツ、ジェームスJ; オグレン、フィリップ5世; 鄭、嘉平; ソン、スンファン; Kipper-Schuler、Karin C; シュート、クリストファーG（2010）。「メイヨークリニックテキスト分析および知識抽出システム（cTAKES）：アーキテクチャ、コンポーネント評価およびアプリケーション」。アメリカ医療情報学会誌。17（5）：507–513。土井：10.1136 /jamia.2009.001560。ISSN 1067から5027まで。PMC 2995668。PMID 20819853。 ^ “歴史”。ApachecTAKES™-臨床テキスト分析知識抽出システム。2015-06-22 。

外部リンク
cTAKES公式サイト
ApacheのcTAKESプロジェクト情報ページからASF
アブストラクト（JAMIA）
オープンヘルス自然言語処理（OHNLP）コンソーシアム
戦略的健康IT先端研究プロジェクト（SHARP）プログラム
シャープエリア4-EHRデータの二次利用
自動検索コンソール（ARC）
健康情報テキスト抽出（HITEx））は、i2b2プロジェクトの一部として開発されました。これは、生物学とベッドサイドを統合するためにInformaticsによって開発されたGATEフレームワークに基づくルールベースのNLPパイプラインです。
計算言語および教育研究ツールキット（cleartk）（現在は保守されていません）は、コロラド大学ボルダー校で開発されており、Javaで統計的NLPコンポーネントを開発するためのフレームワークを提供します。ApacheUIMAの上に構築されています。
NegEx-ピッツバーグ大学で開発されたツールで、臨床テキストから否定された用語を検出します。システムは、文内の可能性のある否定シナリオを決定する方法としてトリガー用語を利用します。
ConText）：NegExの拡張であり、ピッツバーグ大学によっても開発されています。ConTextはNegExを拡張して、否定された概念を検出するだけでなく、時間的（最近、歴史的、または仮想的なシナリオ）および（経験の）サブジェクトが誰であるか（患者またはその他）を検出します。
MetaMap（米国国立医学図書館による）：統合医療言語システムの上に構築された包括的な概念タグ付けシステムです。使用するには、有効なUMLSメタセサウルスライセンス契約（およびアカウント）が必要です。
MedEx-臨床テキストから投薬情報を抽出するためのツール。MedExは、フリーテキストの臨床記録を処理して、薬剤名と、薬剤の投与量、頻度、経路、期間などの署名情報を認識します。UMLSライセンスでの使用は無料です。LinuxおよびWindows用のスタンドアロンアプリケーションです。
SecTag（セクションタグ付け階層）：NLP、ベイジアン、スペル修正、およびスコアリング手法を使用して、メモセクションヘッダーを認識します。UMLSまたはLOINCライセンスのいずれかで無料で使用できます。（Stanford Named Entity Recognizer（NER））：StanfordのNERは、条件付き確率場シーケンスモデルであり、英語とドイツ語での名前付きエンティティ認識のための適切に設計された機能を備えています。（Stanford CoreNLP）は、トークン化、品詞タグ付け、名前付きエンティティの認識、解析、および共参照を含む、Javaでの英語用の自然言語処理ツールの統合スイートです。
“