两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

文本摘要生成方法和裝置、電子設備及存儲介質與流程

文檔序號:40638866發(fā)布日期:2025-01-10 18:45閱讀:1來源:國知局
文本摘要生成方法和裝置、電子設備及存儲介質與流程

本技術涉及金融科技,尤其涉及一種文本摘要生成方法和裝置、電子設備及存儲介質。


背景技術:

1、文本摘要生成是指從原始文本中提取關鍵信息,并生成一個簡短、連貫且能夠準確反映原始文本內容的摘要文本的過程。在金融科技的保險銷售場景中,電話銷售人員通常需要在與客戶進行電話溝通后,對整理的通話記錄進行關鍵信息提取,以生成通話摘要文本,則可以根據該通話摘要文本對客戶進行精準的銷售策略制定和話術推薦。

2、相關技術通??梢圆捎贸槿∈秸傻姆椒?,即通過從原始文本中找到包含重要內容的句子,并對選擇的句子進行打分排列以生成摘要文本。然而,這種方式容易導致生成的摘要缺乏連貫性,且容易存在冗余信息?;诖?,相關技術還可以通過對原始文本進行文本語義理解,并根據理解的文本語義重新組織生成新的句子作為摘要文本。然而,這種方式容易導致重復生成相同且缺乏重要信息的摘要,從而降低摘要文本的生成準確性。因此,如何提高文本摘要的生成準確性,成為了亟待解決的技術問題。


技術實現思路

1、本技術實施例的主要目的在于提出一種文本摘要生成方法和裝置、電子設備及存儲介質,旨在提高文本摘要的生成準確性。

2、為實現上述目的,本技術實施例的第一方面提出了一種文本摘要生成方法,所述方法包括:

3、獲取原始文本和預設知識圖譜,所述預設知識圖譜為基于所述原始文本對應的場景歷史數據構建,所述預設知識圖譜包括預設實體關系;

4、基于預設的文本主題分類模型對所述原始文本進行主題分類,得到文本主題類別;

5、基于預設的摘要生成模型對所述原始文本和所述文本主題類別進行摘要生成,得到候選摘要文本;

6、基于所述預設知識圖譜對所述候選摘要文本進行實體關系檢測,得到實體關系匹配程度,所述實體關系匹配程度用于表征所述候選摘要文本中的實體關系與所述預設實體關系之間的匹配程度;

7、對所述候選摘要文本進行文本特征提取,得到候選文本特征;

8、對所述原始文本進行文本特征提取,得到原始文本特征;

9、根據所述實體關系匹配程度、所述候選文本特征和所述原始文本特征對所述候選摘要文本進行文本選擇,得到目標摘要文本。

10、在一些實施例中,所述根據所述實體關系匹配程度、所述候選文本特征和所述原始文本特征對所述候選摘要文本進行文本選擇,得到目標摘要文本,包括:

11、對所述候選文本特征和所述原始文本特征進行相似度計算,得到文本相似度;

12、基于所述實體關系匹配程度確定相似度權重;

13、對所述相似度權重和所述文本相似度進行加權計算,得到所述候選摘要文本的目標相似度;

14、基于所述目標相似度從所述候選摘要文本中確定所述目標摘要文本。

15、在一些實施例中,所述基于所述預設知識圖譜對所述候選摘要文本進行實體關系檢測,得到實體關系匹配程度,包括:

16、對所述候選摘要文本進行實體關系提取,得到預測實體關系;

17、對所述預設實體關系和所述預測實體關系進行實體關系匹配,得到實體關系匹配數據;

18、基于所述實體關系匹配數據確定所述實體關系匹配程度。

19、在一些實施例中,所述文本主題分類模型包括文本編碼子模型、序列提取子模型和主題分類子模型;所述基于預設的文本主題分類模型對所述原始文本進行主題分類,得到文本主題類別,包括:

20、基于所述文本編碼子模型對所述原始文本進行文本編碼,得到文本編碼向量;

21、基于所述序列提取子模型對所述文本編碼向量進行序列提取,得到文本序列向量;

22、基于所述主題分類子模型對所述文本序列向量進行主題分類,得到所述文本主題類別。

23、在一些實施例中,所述基于所述文本編碼子模型對所述原始文本進行文本編碼,得到文本編碼向量,包括:

24、對所述原始文本進行文本預處理,得到分詞文本;

25、對所述分詞文本進行文本詞編碼,得到詞嵌入向量;

26、基于所述原始文本對所述詞嵌入向量進行向量拼接,得到所述文本編碼向量。

27、在一些實施例中,所述基于所述主題分類子模型對所述文本序列向量進行主題分類,得到所述文本主題類別,包括:

28、基于所述文本序列向量對所述原始文本進行關鍵詞提取,得到文本關鍵詞;

29、基于所述文本關鍵詞從預設分主題類別中確定文本分主題類別;

30、基于所述文本分主題類別對所述文本關鍵詞進行詞聚類,得到候選聚類組;

31、基于所述候選聚類組中包含的所述文本關鍵詞的數量確定目標聚類組;

32、基于所述目標聚類組和所述文本分主題類別確定文本總主題類別;

33、基于所述文本分主題類別和所述文本總主題類別得到所述文本主題類別。

34、在一些實施例中,所述基于預設的摘要生成模型對所述原始文本和所述文本主題類別進行摘要生成,得到候選摘要文本,包括:

35、基于所述摘要生成模型對所述原始文本和所述文本分主題類別進行摘要生成,得到候選分主題摘要文本;

36、基于所述摘要生成模型對所述原始文本和所述文本總主題類別進行摘要生成,得到候選總主題摘要文本;

37、對所述候選分主題摘要文本和所述候選總主題摘要文本進行文本整合,得到所述候選摘要文本。

38、為實現上述目的,本技術實施例的第二方面提出了一種文本摘要生成裝置,所述裝置包括:

39、獲取模塊,用于獲取原始文本和預設知識圖譜,所述預設知識圖譜為基于所述原始文本對應的場景歷史數據構建,所述預設知識圖譜包括預設實體關系;

40、分類模塊,用于基于預設的文本主題分類模型對所述原始文本進行主題分類,得到文本主題類別;

41、生成模塊,用于基于預設的摘要生成模型對所述原始文本和所述文本主題類別進行摘要生成,得到候選摘要文本;

42、檢測模塊,用于基于所述預設知識圖譜對所述候選摘要文本進行實體關系檢測,得到實體關系匹配程度,所述實體關系匹配程度用于表征所述候選摘要文本中的實體關系與所述預設實體關系之間的匹配程度;

43、第一特征提取模塊,用于對所述候選摘要文本進行文本特征提取,得到候選文本特征;

44、第二特征提取模塊,用于對所述原始文本進行文本特征提取,得到原始文本特征;

45、選擇模塊,用于根據所述實體關系匹配程度、所述候選文本特征和所述原始文本特征對所述候選摘要文本進行文本選擇,得到目標摘要文本。

46、為實現上述目的,本技術實施例的第三方面提出了一種電子設備,所述電子設備包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執(zhí)行所述計算機程序時實現上述第一方面所述的方法。

47、為實現上述目的,本技術實施例的第四方面提出了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現上述第一方面所述的方法。

48、本技術提出的一種文本摘要生成方法和裝置、電子設備及存儲介質和裝置、電子設備及存儲介質,其通過獲取原始文本和預設知識圖譜,該預設知識圖譜為基于原始文本對應的場景歷史數據構建,且預設知識圖譜包括預設實體關系;進一步地,基于預設的文本主題分類模型對原始文本進行主題分類,得到文本主題類別;進一步地,基于預設的摘要生成模型對原始文本和文本主題類別進行摘要生成,得到候選摘要文本;進一步地,基于預設知識圖譜對候選摘要文本進行實體關系檢測,得到實體關系匹配程度,該實體關系匹配程度用于表征候選摘要文本中的實體關系與預設實體關系之間的匹配程度;進一步地,對候選摘要文本進行文本特征提取,得到候選文本特征;對原始文本進行文本特征提取,得到原始文本特征;最后,根據實體關系匹配程度、候選文本特征和原始文本特征對候選摘要文本進行文本選擇,得到目標摘要文本。本技術實施例可以先對原始文本進行主題分類,并結合原始文本和文本主題類別進行摘要生成,從而可以更準確地定位生成與原始文本的類別關聯的候選摘要文本。進一步地,可以基于預設知識圖譜、候選文本特征和原始文本特征進一步對候選摘要文本進行文本篩選,以得到更準確的目標摘要文本。因此,本技術可以有效提高文本摘要的生成準確性。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
潞城市| 陆丰市| 定安县| 阳谷县| 特克斯县| 吉隆县| 吴川市| 井陉县| 湟中县| 石景山区| 日喀则市| 渭源县| 赣榆县| 富蕴县| 临湘市| 宝清县| 金堂县| 陆丰市| 汝南县| 肇东市| 措勤县| 新密市| 新乐市| 应城市| 临湘市| 五原县| 于都县| 鄄城县| 平阳县| 邵东县| 宜兰市| 辛集市| 宾阳县| 精河县| 永寿县| 岳西县| 通辽市| 汽车| 招远市| 平湖市| 裕民县|