搜論文知識網
您當前的位置:首頁 > 論文 > 醫學論文 > 藥學論文>在線醫療社區醫患群體及問答記錄特征研究 ——以“好大夫在線”糖尿病主題分析為例*>正文

在線醫療社區醫患群體及問答記錄特征研究 ——以“好大夫在線”糖尿病主題分析為例*

來源:搜論文知識網位置:藥學論文時間:2019-05-22 09:53

   摘 要:本文以“好大夫在線”問答中糖尿病主題相關的十年數據為例,揭示在線醫療社區的患者、醫生及問答記錄的特征。研究發現,患者人群覆蓋所有糖尿病類型,出現多種并發癥;患病時長較長的用戶更愿意在網上咨詢;患者的過敏原大多數屬于食入式或注射式過敏原;醫生的臨床職稱和教學科研職稱存在一定的正相關關系;醫生所屬的醫院具有明顯的集中與分散的特點,少部分醫院吸引大多數患者進行咨詢;醫生所屬的科室較為分散;較活躍的醫生來自于三級醫院,且大多數屬于內分泌科;患者提問主題的大致分為 7 類,圍繞著糖尿病及其并發癥展開;大多數患者希望從治療過程、治療手段和醫治程度等方面得到醫生的幫助。

在線醫療社區醫患群體及問答記錄特征研究

  關鍵詞:好大夫在線;醫患群體;問答記錄;糖尿病

  0 引言

  在線醫療社區是醫療服務的新型業態,依托于互聯網信息技術,將醫療服務從線下轉移到線上。在線醫療社區按服務主體分類可分為三類:一是患者交流平臺,主要用戶為患有相同或相似病癥的患者,如甜蜜家園、慢友幫;二是醫生交流平臺,主要為醫生提供學術交流和在線培訓等,如丁香園、好醫生;三是醫患交流平臺,具備醫生和患者兩類用戶,主要為醫患之間的健康管理、健康咨詢、掛號、導診、問診、藥品購買等交流提供平臺,比如“好大夫在線”、春雨醫生等[1]。“好大夫在線”是國內最大的醫患互動平臺,2006 年誕生至今,積累了大量醫患數據。糖尿病是一種由于胰島素分泌不足或外周組織對胰島素不敏感引起的代謝性疾病,以持續高血糖狀態為特征,并可能引發 100 多種并發癥。糖尿病病人由于患病時間長,更易在醫療社區瀏覽和發布信息。因此,本文以“好大夫在線”的問答數據為例,通過數據分析,探討與糖尿病主題相關患者、醫生與醫患問答的特征。

  1 研究現狀

  在線醫療社區目前沒有統一的定義,存在若干相似概念。筆者在中國知網中以“在線醫療社區”“在線醫療平臺”“在線健康平臺”“在線健康社區”“健康醫療社區”“健康醫療平臺”作為主題詞進行檢索,共有 392 條記錄,集中于近 5 年,說明相關研究處于起步階段。相關主題研究熱點包括患者研究、醫生研究、醫患交互研究、系統設計與構建研究、現狀研究、慢性病研究等。

  1.1 關于患者群體的研究

  在線醫療社區患者特征的研究主要包括四個方面。一是患者使用在線醫療社區的意愿研究,從影響因素、影響關系等方面展開,表明社會支持、成就需要、隱私安全、感知信任、醫療效果、感知收益和交互設計等都有正向影響[2-3]。二是患者信息披露與個人隱私的顧慮研究,從影響因素、影響模型構建等方面展開,發現患者性格、信息敏感、以往經歷、情感承諾、外部保護和醫生信譽等都對患者的信息披露與隱私顧慮產生了影響[4-9]。三是患者的社區參與和知識共享行為研究,發現利他性、歸屬感、互動中心性、等價性、交互感知和社區回報對共享行為產生影響,且不同用戶存在差異[10-13]。四是研究患者的購買意愿,影響因素有網絡口碑、患者生成信息和醫生生成信息等[14-15]。

  1.2 關于醫生群體的研究

  醫生特征的研究集中在對醫生聲譽、服務價格、個人貢獻、疾病類型、咨詢量和個人收益等之間的關系的研究。劉笑笑以“好大夫在線”為例,發現醫生的在線信譽和努力對醫生咨詢量都有顯著影響[16]。韓曉翠基于“好大夫在線”醫生的數據,發現醫生的經濟回報、名譽回報及線下身份對貢獻行為有積極影響[17]。李洋從糖尿病、冠心病和乳腺癌 3 種慢性病入手,發現不同疾病的醫生貢獻行為的影響因素存在差異[18]。李瑩瑩發現服務評價、醫生職稱、醫生所在醫院都對服務價格有顯著影響[19]。葉存輝等以“好大夫在線”為例,研究了醫生受訪量的影響因素,發現相對于醫生職稱,患者更在乎醫院等級[20]。梁俏等基于 2008-2016 年“好大夫在線”的數據分析,認為醫生及其同事的努力和聲譽對參與免費咨詢的新患者數有顯著影響[21]。

  1.3 關于問答記錄的研究

  李蕾等總結社會化問答主要包括問題、答案、用戶和平臺四個部分[22],而在醫療領域,主要是問答主題特征研究。呂英杰等研究 Medhelp 社區中肺癌、乳腺癌和糖尿病 3 種疾病,并提取了 7 各熱點主題[23]。金碧漪等基于問答網站和糖尿病社區的數據得出糖尿病的主題分布特征[24]。王煜等以尋醫問藥網中糖尿病社區的帖子內容為分析對象,采用矢量空間模型和 K-Means 聚類模型進行主題分析,得出“癥狀與并發癥”“治療”兩個熱點主題[25]。綜上所述,已有研究成果主要基于問卷調查、網絡數據爬取、社會網絡分析等方法對單一主題進行探討,且數據量較少。筆者將以“好大夫在線”為例,通過對十年來糖尿病相關主題參與問答的醫患群體及問答本身的特征分析,全面揭示患者、醫生及問答三個方面的具體特征,以期為優化在線醫療社區服務提供充分的數據與事實支持。

  2 研究設計

  2.1 研究思路

  本文將基于 python 爬蟲數據對在線醫療社區中醫患問答相關特征進行分析,與前人研究方式不同的是,將會爬取盡可能完整的、大量的數據作為支撐。研究將分為三個部分進行展開。前兩個部分是醫患問答中的主體,即患者、醫生的特征分析。從患者角度,將從患者的患病類型、患病時長、過敏史三個維度展開。從醫生角度,將從醫生的職稱、所屬的醫院及科室、活躍醫生的特征等維度展開。第三個部分為醫患問答的特征,包括患者提問的時間分布、患者提問的主題特征、患者提問的意向特征等方面展開,并采用 LDA 主題模型、R 語言詞頻統計等方法進行揭示。

  2.2 數據獲取

  “好大夫在線”的“網上咨詢”中提供2008年至今的在線咨詢歷史數據檢索。經觀察可知,問答記錄的格式、各字段的順序、有無都存在差異。因此,筆者選擇爬取全文的方式。筆者用 python 爬取提問題目中包含“糖尿病”關鍵詞的記錄,共爬取到 2008 年 3 月至 2018 年 10 月間 139361 條問答數據。問答數據的數據項包括患者信息、醫生信息、咨詢主題、咨詢日期等四部分,其中患者信息包括患者填寫的疾病/癥狀、患病時長、過敏史等,醫生信息包括醫生的姓名、職稱、醫生所屬的醫院及科室等。

  2.3 數據處理

  由于原數據存在大量自然語言描述,且存在錯別字和空字段等,需要進行預先處理。首先要對自然語言描述進行歸納整合,如將Ⅰ型糖尿病、一型糖尿病等都歸為 1 型糖尿病,將Ⅱ型糖尿病、二型糖尿病等都歸為 2 型糖尿病,將妊娠期糖尿病、懷孕糖尿病都歸為妊娠糖尿病。其次,需處理錯別字,如將壬辰糖尿病、妊辰糖尿病等改為妊娠糖尿病。另外,由于網頁格式差異,一些字段未爬取到,或者網頁失效無法打開,導致數據缺失,需要去掉缺失項。

  3 “好大夫在線”糖尿病患者的特征分析

  3.1 患者所患糖尿病的類型及并發癥

  筆者首先對患者填寫的疾病內容進行整理,得到 111695 條關于疾病或癥狀的描述,有 78.7%(87894 人)的患者使用“糖尿病”來描述自身的疾病或癥狀。在前 100 個高頻詞中,顯示了 1 型糖尿病、2 型糖尿病和妊娠糖尿病三大糖尿病的類型,2 型糖尿病的記錄數最多。另外,高頻詞中體現了糖尿病的常見并發癥,包括:糖尿病腎病(腎功能不全、腎病)、糖尿病眼部并發癥(視網膜病變、白內障、眼底出血、視力模糊、視力下降)、糖尿病足、糖尿病心血管并發癥(高血壓、冠心病、心臟病、心絞痛、心衰、心梗、房顫)、糖尿病性腦血管病(腦梗、腦血栓)和糖尿病神經病變(糖尿病周圍神經病變)等。

  3.2 患者的患病時長分布

  經整理,有患病時長字段的咨詢記錄共有 33815 條。其中 52%(17475 人)的患者患病時長超過半年,18%(6145 人)的患者患病時長在半年之內,17%(5785 人)的患者患病時間小于 1 個月,13%(4410 人)的患者患病時長不超過 1 周。可見,患病時間較長的用戶更愿意在網上咨詢。

  3.3 患者的過敏史

  經整理,填寫了有效的過敏史的數據記錄共 1151 條,包括具體的過敏原、過敏物或過敏表現。筆者將出現 3 次及以上的過敏記錄進行歸類,如表 1 所示,括號內數字表示出現次數。過敏原可分為吸入式過敏原、食入式過敏原、接觸式過敏原和注射式過敏原。因患者未描述藥品過敏的方式,因此將食入式和注射式歸為一類。大部分過敏記錄(1015 例, 88%)都屬于食入或者注射方式,筆者又將食入式/注射式過敏原分為藥物類和食物類,其中,藥物類占大多數。在藥物類中,除常見的過敏原青霉素類、頭孢類、磺胺類、外,還有糖尿病用藥,如胰島素、二甲雙胍等,少量患者對此有過敏現象。有的患者對于藥物過敏的描述較為模糊,如感冒藥、止疼藥等。另外,少部分患者描述的是過敏性疾病本身,如過敏性哮喘、過敏性咳嗽,而非具體的過敏原。

  4 “好大夫在線”回復糖尿病咨詢的醫生特征分析

  經統計,共有 17661 位醫生參與了 119697 次在線咨詢,醫生人數大致隨著回復記錄數的增加而下降,大部分的醫生對在線咨詢的回復數在 10 次以內。具體為:89.92%(15881 人)的醫生的回復少于 10 次,其中,51.03%(9013 人)的醫生只參與了 1 次咨詢;9.17% (1619 人)的醫生回復在 10 次到 100 次之間;0.91%(161 人)的醫生回復在 100 次以上,總計為 43769 次咨詢記錄,占總記錄數的 37%。其中,0.02%(4 人)的醫生回復超過 1000 次。可見,少部分醫生(10.08%,1780 人)參與了大部分的咨詢(71.72%,85852 條)。

  4.1 醫生的職稱特征

  經過對 17661 條醫生的職稱信息的統計,醫生的臨床職稱包括住院醫師、主治醫師、副主任醫師、主任醫師、主任技師等 18 種,前 4 種占大多數。醫生的教學科研職稱包括助教、講師、副教授、教授、副研究員、研究員等。住院醫師和主治醫師中,無科研職稱的占大多數;副主任醫師中,副教授占大多數;主任醫師中,教授占大多數。醫生的臨床職稱和教學科研職稱的對應關系如圖 1 所示。可見,臨床體系中的職稱與教學科研中的職稱呈現一定的正相關關系。

  4.2 醫生所屬的醫院及科室類別

  4.2.1 醫生所屬的醫院

  17661 位醫生來自于 2922 所醫院,其中,醫生記錄數大于(或等于)100 的醫院共有 22 所,按照參與網絡咨詢的醫生人數排名,分別是:好大夫工作室、鄭州大學第一附屬醫院、中國人民解放軍總醫院(301 醫院)、北京協和醫院、北京同仁醫院、武漢協和醫院、上海交通大學醫學院附屬第九人民醫院、山東省立醫院、東部戰區總醫院(原南京軍區總醫院)、上海交通大學醫學院附屬仁濟醫院、復旦大學附屬華山醫院、北京大學第一醫院、空軍軍醫大學西京醫院、中國中醫科學院廣安門醫院、中日友好醫院、北京大學人民醫院、北京大學第三醫院、未收錄醫院、山東大學齊魯醫院、四川大學華西醫院、江蘇省人民醫院和中國醫學科學院阜外醫院。除去好大夫工作室和未收錄醫院,其他 20 所醫院中參與網絡咨詢的醫生共為 2817 人,占醫生總人數的 15.95%。20 所醫院中,從等級來看,均屬于三級甲等醫院;從類別來看,18 所屬于綜合性醫院的,2 所是專科醫院,分別是中國中醫科學院廣安門醫院(中醫醫院)和中國醫學科學院阜外醫院(心血管專科醫院)。

  4.2.2 醫生所屬的科室類別

  不同醫院的科室分類存在差異,大型醫院和小型診所分類的粒度不一樣,科室的名稱也不一定規范。經統計,17661 位醫生來自 1653 個科室,所屬的科室較為分散。其中,醫生人數大于(或等于)100 人次的科室共計 37 個。這 37 個科室收納了 68.9%(12169 人)的醫生。可看出糖尿病不同于與其他疾病的一大特點,即有很多并發癥。其中,眼科、內分泌科、泌尿外科、神經外科、骨科、婦產科、皮膚科的醫生人數最多,與上文中患者所患疾病類型和糖尿病易皮膚過敏相對應。

  4.3 活躍醫生的特征

  從醫生個人的回復行為來看,筆者認為回復次數多的醫生,一方面表現出醫生的活躍,另一方面表現出有大量患者依賴。筆者將回復記錄超過 500 條的醫生列舉于表 2,記錄總計為 15326 條,占總記錄數的 12.8%;醫生為 19 人,占總醫生數 0.1%。除未收錄醫院的醫生外,其他醫生都來自三級醫院,且大多數屬于內分泌科。

  5 “好大夫在線”糖尿病醫患問答特征分析

  5.1 患者提問的時間特征

  筆者將糖尿病問答記錄按照患者提問時間統計,如圖 2 所示,從 2008 年 3 月到 2011 年底數量快速增長,患者用戶群體快速增加。2012 年增幅減小,但達到歷年記錄數最大。隨后,從 2013 年開始,患者提問減少,之后也未有大幅回升。其中,2018 年只統計至 10 月,預估年底會達到近 5 年來的高峰值。可見,使用好大夫的糖尿病患者用戶數量從百位數增至萬位數,并非持續增長。就這十年來看,大致每 5 年達到一個高峰值。

  5.2 患者提問的主題特征

  由于隱私保護,問答的內容只能醫生和病人可見,而提問的題目是公開的。因此筆者使用 R 語言中的 LDA 包,對患者的提問進行聚類并可視化,分析糖尿病問答的主題特征。如圖 3 所示,左邊的圓代表不同的聚類主題。通過設置不同的聚類個數來看聚類效果,發現聚為 7 類時的效果最好(圓圈之間無交叉)。右邊藍色柱條表示該詞在整個問答文檔中的詞頻,紅色柱條表示該詞在該聚類的估計頻率。如選擇主題 1,“糖尿病”貢獻最多,其次是“治療”。去掉“如何”“什么”“可以”等無貢獻意義的詞,經歸納后得到 7 個患者提問的主題:糖尿病治療、糖尿病血糖控制、糖尿病心血管并發癥治療、糖尿病足治療、妊娠糖尿病治療、糖尿病腎病及其他并發癥治療和糖尿病眼部并發癥治療等,主題基本圍繞糖尿病及其并發癥展開。

  5.3 患者提問的意向特征

  問答數據中包含“希望得到的幫助”或“想得到怎樣的幫助”字段,該字段表達患者的提問意向。經處理,共有 103595 條問答中記錄了意向字段。筆者用 R 語言進行詞頻統計,篩選出詞頻在 500 以上且有意義的關鍵詞,如表 3 所示。總體看,患者希望得到治療糖尿病的方案。從患者主體看,除了“我”“我們”外,還有“孩子”“父親”“母親”“老人”等。因此,很多患者用戶除咨詢自身病情外,也有代替孩子和長輩向醫生咨詢的。從治療過程看,患者更多的會尋問去哪個醫院(或門診)預約、就診、化驗、復查、換藥等。從治療手段來看,大多數患者尋問醫生關于手術、用藥、飲食、住院治療、中醫治療等方式。從治療程度上看,希望能有效控制、緩解、改善、根治、恢復等。另外,很多患者希望醫生能告知糖尿病的并發癥以及其診療方式,和診療費用等。可知,在線醫療社區的患者咨詢,并不能完全替代線下治療方式。更多是起到連接患者與線下醫生(或醫院)進行治療的橋梁作用和輔助線下治療的作用。

  本文以“好大夫在線”問答中糖尿病相關的十年數據為例,探究了在線醫療社區的患者、醫生、問答記錄的特征。揭示了糖尿病患者的糖尿病類型及并發癥、患病時長與線上治療意向的關系、過敏史信息、醫生的臨床職稱與教學科研職稱的關系、醫生所在醫院科室、活躍醫生的特征、患者提問的時間、主題和意向特征。研究發現,患者人群覆蓋所有常見的糖尿病類型,出現多種并發癥;患病時長較長的用戶更愿意在網上咨詢;少部分患者有過敏現象,且大多數屬于食入式或注射式過敏;醫生的臨床職稱與教學科研職稱呈現一定的正相關關系,教學科研職稱越高,臨床職稱也相對越高;醫生所屬的醫院具有明顯的集中與分散的特點,多數患者集中于少部分醫院進行咨詢;醫生所屬的科室較為分散;活躍的醫生來自于三級醫院,且大多數屬于內分泌科。糖尿病患者用戶提問數量有著時間周期性波動的特點,大致呈現每 5 年達到一個高峰值。提問主題可以分為 7 類,包括糖尿病及其并發癥的治療。患者的提問意圖是希望得到關于治療過程、手段和程度等方面的幫助。筆者初步對“好大夫在線”醫療社區平臺進行了關于糖尿病主題問答的患者和醫生的畫像,以及揭示了問答的相關特征。可為糖尿病患者尋找網上咨詢的醫生提供借鑒,為優化平臺的服務提供參考。本文只針對“好大夫在線”這一平臺的糖尿病主題問答相關內容進行了研究,具有一定的局限性,且對每個特征的關聯研究不夠,未來將對特征之間的關聯關系進行深入的研究。

  參考文獻

  [1]馬騁宇.在線醫療社區發展現狀淺析[J].中國醫院管理,2018(5):58-60.

  [2]吳江,李姍姍.在線健康社區用戶信息服務使用意愿研究[J].情報科學,2017(4):119-125.

  [3]胡志偉.在線醫療信息服務的用戶行為規律及實證研究[D].南昌大學,2017.

  [4]解可欣.在線醫療服務用戶個性與隱私顧慮作用研究[D].哈爾濱工業大學,2015.

  在線醫療社區醫患群體及問答記錄特征研究相關論文期刊你還可以瀏覽:《中國醫療保險國家級醫學期刊發表

轉載請注明來自:http://www.foyspm.tw/fblw/yixue/yaoxue/40210.html

相關文章:

藥學論文發表流程

藥學論文發表流程-搜論文知識網

搜論文知識網是藥學論文發表正規機構。致力于為需要刊登藥學論文的人士提供相關服務。

藥學論文發表咨詢電話:4006800558

相關論文閱讀

優質期刊推薦

省級期刊、國家級期刊、核心級期刊快速發表,藥學論文發表就找搜論文知識網

核心期刊推薦

精品論文推薦

345456蓝月亮心水论坛