Pages

Weibo SuperTopic微博超话爬虫 API接口解析
微博作为国内最大的社交平台,用户的话题,评论,点赞,转发等数据对社会网络分析,或社会大数据分析有很大的帮助,因此构建一个用于学术的微博爬虫很有必要,特别是超话,其作为微博的粉丝社群功能,相比于普通话题或帖子更具有群体性,更适合作为社会学相关的研究数据使用,本文将介绍网页端的微博超话后端API接口和逻辑。Weibo 微博评论爬虫 API接口解析
微博作为国内最大的社交平台,用户的话题,评论,点赞,转发等数据对社会网络分析,或社会大数据分析有很大的帮助,因此构建一个用于学术的微博爬虫很有必要,本文将仅介绍现有的一些私有微博API接口,代码部分将不详细赘述。
Biterm Topic Model 适用于短文本的主题模型
Biterm Topic Model 基于词对的主题模型,相较于LDA的文档主题分布,利用词对对整个语料库进行分布建模,解决了短文本数据量不足的问题,本文将基于Biterm论文对Biterm Topic Model进行介绍。
2024-07-29
2 min read

朝鲜日报搜索API爬虫 조선일보 Crawler use API by Python
通过对朝鲜日报网站的http请求包分析,构造文章搜索请求API,获取搜索文章列表。
2024-04-14
3 min read
工作时长和收入间的线性关系 Linear Regression
用单变量线性回归对KGSS 2021年的调查数据中 收入 与 工作时长 两个变量间的线性关系进行分析
2023-06-21
3 min read
Experience
Master's degree candidate
2023 - Present
- 🕷️ Data Crawling
- 🤖 Topic Model
- 📄 Sociology Theories
- 💻 Social NetWork Analysis
Undergraduate Student
2018 - 2022
- 📱 Programming
- Tailwind CSS
- Python Django
- 🧑🏻💻 AZURE
- WEB APP
- DATABASE
- BLOB …
- ✍🏼 Sociology
- Social Research Methodology
- TOPIK 6
Life is Just for Fun and Love
blog.jmsu.me