Pages

Featured Image

Weibo SuperTopic微博超话爬虫 API接口解析

微博作为国内最大的社交平台,用户的话题,评论,点赞,转发等数据对社会网络分析,或社会大数据分析有很大的帮助,因此构建一个用于学术的微博爬虫很有必要,特别是超话,其作为微博的粉丝社群功能,相比于普通话题或帖子更具有群体性,更适合作为社会学相关的研究数据使用,本文将介绍网页端的微博超话后端API接口和逻辑。
2024-09-20
3 min read

Weibo 微博评论爬虫 API接口解析

微博作为国内最大的社交平台,用户的话题,评论,点赞,转发等数据对社会网络分析,或社会大数据分析有很大的帮助,因此构建一个用于学术的微博爬虫很有必要,本文将仅介绍现有的一些私有微博API接口,代码部分将不详细赘述。
2024-08-29
2 min read
Featured Image

Biterm Topic Model 适用于短文本的主题模型

Biterm Topic Model 基于词对的主题模型,相较于LDA的文档主题分布,利用词对对整个语料库进行分布建模,解决了短文本数据量不足的问题,本文将基于Biterm论文对Biterm Topic Model进行介绍。
2024-07-29
2 min read
Featured Image

朝鲜日报搜索API爬虫 조선일보 Crawler use API by Python

通过对朝鲜日报网站的http请求包分析,构造文章搜索请求API,获取搜索文章列表。
2024-04-14
3 min read

工作时长和收入间的线性关系 Linear Regression

用单变量线性回归对KGSS 2021年的调查数据中 收入 与 工作时长 两个变量间的线性关系进行分析
2023-06-21
3 min read

Experience

Master's degree candidate

2023 - Present
  • 🕷️ Data Crawling
  • 🤖 Topic Model
  • 📄 Sociology Theories
  • 💻 Social NetWork Analysis

Undergraduate Student

  • 📱 Programming
    • Tailwind CSS
    • Python Django
  • 🧑🏻‍💻 AZURE
    • WEB APP
    • DATABASE
    • BLOB …
  • ✍🏼 Sociology
    • Social Research Methodology
    • TOPIK 6
Life is Just for Fun and Love

blog.jmsu.me