在内容分析、搜索引擎优化(SEO)、智能推荐、舆情监控、知识图谱构建等场景中,快速准确地从一段文本中提取核心关键词是基础而关键的一步。然而,中文分词与关键词抽取涉及复杂的语言模型和算法,自研成本高、效果难保证。TianAPI 提供的「抽取关键词」接口为开发者提供了一个极简、高效、低成本的解决方案。
关键词抽取API能够自动分析一段中文文本,智能识别并返回其中最具代表性的关键词。无论是新闻摘要、用户评论、产品描述还是社交媒体内容,该接口都能精准抓取核心词汇,帮助开发者构建智能搜索、内容推荐、舆情分析等应用。
| 特性 | 说明 |
|---|---|
| ✓ 高效关键词抽取 | 基于 NLP 模型,自动识别文本核心词汇 |
| ✓ 灵活返回数量 | 通过 num 参数控制返回关键词个数(默认 10,999 表示不限) |
| ✓ 支持词性标注 | 设置 wordtag=1 可返回每个词的词性代码(如名词、动词等) |
| ✓ 轻量文本处理 | 单次请求支持 最多 1000 字符 的中文文本 |
| ✓ 按次计费 | 5 天豆/次(约 ¥0.0005/次),性价比极高 |
| ✓ 免费试用 | 注册即送 800 次 调用额度 |
访问天聚数行官网注册账号→进入抽取关键词接口文档页面→点击【申请接口】;点击右上角控制台→数据管理→我的密钥→查看系统自动分配 API Key→保存你的 key,后续请求将用它进行身份验证。接口文档地址:https://www.tianapi.com/apiview/46
情况1:不返回词性(wordtag=0,默认)
newslist:关键词数组,按重要性排序
情况2:返回词性(wordtag=1)
word:词语
word_tag:词性代码(如 63=地名,1=名词,2=动词等)
index:排序序号(越小越重要)
文本预处理
去除 HTML 标签、特殊符号、多余空格
对用户输入做长度校验(≤1000字符)
合理设置 num
标签场景:num=3~5
分析场景:num=10~20
全面提取:num=999
词性过滤(高级用法)
若开启 wordtag=1,可后续过滤:
仅保留名词(word_tag=1)和地名(63)
排除动词、副词等干扰项
缓存高频内容
对相同文本的关键词结果做缓存,避免重复调用。
安全建议
生产环境中建议配置 IP 白名单,防止 API Key 泄露滥用。
敏感内容请勿直接传输,注意数据合规性。
1、新闻/文章自动打标签
2、用户评论关键词分析
3、搜索引擎关键词提取
4、内容推荐系统特征提取
5、舆情监控热点词识别
6、用户评论关键词云
TianAPI 抽取关键词接口不是最复杂的 NLP 工具,但它是最实用、最易集成、最具性价比的文本摘要利器。他以简单易用、响应迅速、价格亲民的特点,成为中文文本智能处理的理想选择。无论你是独立开发者、学生项目,还是企业级应用,都能以极低成本快速实现专业级关键词提取。
相关服务: