0%

中国政府统计数据质量研究——一个文献综述

这篇笔记是对文章的一个总结

refer: 赵学刚, 王学斌, & 刘康兵. (2011). 中国政府统计数据质量研究——一个文献综述. 经济评论, 1, 145–154. https://doi.org/10.19361/j.er.2011.01.016

1. 引言

  • 研究背景:近年来中国政府数据统计质量问题日益受到关注
  • 研究意义:评估数据质量对经济决策和研究至关重要
  • 论文结构:理论研究、经验证据、对策探讨

2. 统计数据质量的理论研究

2.1 统计数据质量的定义和标准

  • 11个衡量标准:适用性、准确性、及时性等
  • 核心标准:准确性

2.2 统计数据失真机理

  • 统计部门行为:设计误差、调查误差、汇总误差
  • 统计主体间博弈:企业与统计部门、上下级、区域间基于利益的博弈
  • GDP核算体系缺陷:产业部门分类过粗、服务业统计不足等
  • 统计管理体制问题:统计独立性不足、地方干预等

2.3 统计数据质量控制

  • 抽样调查方法
  • 非抽样误差控制技术
  • 测量误差研究
  • CPI偏差研究

2.4 统计数据质量评估

  • 事后预测和反常结果判断法
  • 一致性误差和非一致性误差分析
  • 国际标准评估框架(如DQAF)
  • 数据质量客观评价算法

2.5 统计数据质量管理

  • 全面质量管理(TQM)原则应用
  • ISO 9000系列标准应用
  • 数据质量管理成熟度模型

3. 统计数据质量评估的经验证据

3.1 国外研究证据

  • 世界银行(1997):1978-1995年中国经济增长率可能被高估
  • Rawski(2001):1998-2001年GDP数据存在夸大
  • Maddison(1998, 2001):1978-1998年GDP增长率可能被高估

3.2 国内研究证据

  • 孟连和王小鲁(2000):1992-1997年工业增长率明显过高
  • 张新和蒋殿春(2002):1998年月度数据存在较大疑点
  • 阙里和钟笑寒(2005):未发现GDP统计数据存在系统性长期错误
  • 王静(2009):GDP数据并不存在显著问题

4. 统计数据质量改进的对策探讨

4.1 政府已采取的措施

  • 改革统计调查方法和汇总方法
  • 细化产业部门分类
  • 建立服务业统计调查制度
  • 完善价格统计

4.2 学者建议

  • 改革统计管理体制:建立垂直领导体制
  • 完善统计指标体系
  • 提高统计透明度
  • 加强统计法律建设
  • 改进GDP核算方法
  • 建立核心CPI指数

5. 结论与展望

  • 主要结论:统计数据质量问题确实存在,但程度和范围存在争议
  • 未来研究方向:
    1. 加强质量控制技术的实际应用研究
    2. 深入研究改进措施的可操作性
  • 政策建议:
    1. 改革统计管理体制,确保统计独立性
    2. 增加统计过程透明度,如CPI权重、房价指数等

Missing Women

前言

在20世纪的中国,改革开放为中国焕发了新的生机。

农村生产体制的改革与劳动力的解放让女性的力量被世界看到

摘要

看了许多视频、博客甚至一些关于flask的书,都没给我一个很好的解决方案,最终的解决方案是在YouTube上的一个老哥的视频,这篇文章主要是把视频的内容按照我的理解变成文字形式.

主要解决了nginx和flask的结合问题,并针对404和502的问题提出了解决方案。

开始部署

准备工作

  • GitHub账号(或者gitee)——托管你的flask-app代码
  • 云服务器(这里采用ubuntu,供应商采用了阿里云)
  • 你的域名(可选)

flask-app代码

为了尽可能的保持一致,我在这里提供一个示例的demo,你也可以在我的GitHub上下载,或者点击这个链接下载。

将示例代码或者你的flask-app放在你的GitHub账号上,以我的示例为例,项目的地址为https://github.com/sepinetam/my-flask-app-demo

云服务器

这里我采用的是阿里云的服务器,操作系统为ubuntu。

PS:Azure学生可以有一台免费的云服务器,Amazon也提供了一年免费的服务器。

域名

我在阿里云购买的域名为sepinetam.com,因为我想搭建的是一个小工具,所以使用了子域名tools.sepinetam.com作为项目的域名。

开始部署

  1. 在云服务器上安装依赖
    你需要的包括但不限于python,nginx,gunicorn

    1
    apt install nginx
  2. 拉取你的项目
    你需要从你的远程仓库拉取项目到服务器上。我的希望后续会部署更多的工具,所以我的项目路径放在了/root/app/tools/my-flask-app-demo/

    1
    2
    3
    4
    5
    6
    7
    cd /root
    mkdir app/tools
    cd app/tools
    # 如果你的app不需要更新也可以直接clone项目,地址换成你自己的项目地址
    # git clone https://github.com/sepinetam/my-flask-app-demo.git
    git pull https://github.com/sepinetam/my-flask-app-demo.git


正经教程

  1. 登录你的服务器

如果是使用pem登陆的话,

1
ssh -i /path/to/your-pem my-user@my-server

进去之后我选择了更改用户,所以我新建了用户

1
adduser sepine

让服务器可以通过password登录

1
2
3
4
nano /etc/ssh/sshd_config
# 把PasswordAuthentication no改成PasswordAuthentication yes
# 重启ssh服务
systemctl restart sshd.service

退出服务器,重新登录(记得把IP与域名先链接上)

1
ssh sepine@my-domain
  1. 克隆项目到本地

这里假设你的项目远程仓库是https://github.com/sepinetam/wCloud-WebApp.git

1
2
3
mkdir app/wcloud
cd app/wcloud
git clone https://github.com/sepinetam/wCloud-WebApp.git
  1. 安装虚拟环境

为了管理方便,我这里采用的虚拟环境的路径在~/env/wcloud, 即/home/sepine/env/wcloud

1
2
3
4
5
python3 -m venv ~/env/wcloud
source ~/env/wcloud/bin/activate

cd ~/app/wcloud
pip install -r requirements.txt

到这里先简单做个测试。

1
python3 app.py

在浏览器中输入http://my-domain:5000/,如果看到页面,说明部署成功。

摘要

最近在部署自己的一个项目到服务器端并链接自己的域名的时候出了一些问题,遂记录一下并整理一下。

为什么做这个项目

起初只是因为有一位社会学的同学问我有没有什么做词云的工具,想了一下发现自己之前在学python的时候做过一个项目是生成词云故二话没说告诉她我能给她写一个这样的app出来,于是就写了这个项目。(PS:当时的项目和这个不一样,那个只是纯后端python跑起来的,这次部署的时候加上了flask框架做了UI)

项目的简单介绍

wCloud

这是一个基于jieba和wordcloud制作词云的项目。

具体详见项目的README文档

wCloud-WebApp

一个基于flask和wCloud的Web App

具体详见项目的README文档

部署过程

本地调试

第一次正经自己做一个flask的app,着实是有些难度,不过好在最后还是搞定了。

最开始只是简单想着既然后端的逻辑function和script已经有了,那就直接做呗,于是让ChatGPT做了几个index.html文件,但是这家伙现在笨的要死,好在成功注册了一个Claude的账号,不得不说Claude还是有点东西的,已经开始考虑把ChatGPT的订阅转到Claude了。

本地调试面临的第一个问题就是如何上传文件。虽然说有很多的信息可以参考,但是还是一头雾水,一方面是没有前端开发的经验,另一方面这也是我第一次写flask的app项目,最后的解决还是得看自己呀,也该思考一下是不是应该更多的把思考方式从直接问AI助手到自己去找资料、搜网页来找解决方案了。(或许以后该写一个关于AI出现后我解决问题的方式的变化的文章)

结束了本地调试

本地调试搞定了,立刻把项目放到了GitHub上,然后准备第二天开始部署。

部署前

Azure&GitHub的”误导”

由于把项目存放在了GitHub上,所以第二天在打开项目的时候看到了右侧有一个部署web app到Azure。兴奋,以为这会很简单,但是我错了,这让我更加一头雾水——根本看不懂那一大堆操作,虽然有Azure的Student订阅,但是还是不了解这是怎么个回事,而且我想把项目部署到我自己的域名tools.sepinetam.com上,于是又去搜了一下,发现Azure的Web App和GitHub的Pages是两个不同的东西,学习成本突然高了起来。遂思考部署到我自己的服务器上——我在Azure、AliCloud、Amazon上都拥有一台EC2实例,最后选择了阿里云。

为什么选择阿里云?

这几台EC2的位置需要提一嘴,阿里云的服务器我买在了长三角,而Azure我选择的是日本、Amazon的则选择了硅谷,考虑到大多数的用户都是中国人,所以选择了阿里云的服务。(阿里云能不能打钱,给我明年的服务器续费便宜点🥺)

开始部署

通过VScode连接上服务器后第一件事是把项目拉取到服务器上(但是我用的clone,不知道以后我要是更新项目的话我是不是要重新部署一下,还是推荐使用pull拉取的方式)

终端执行命令:

1
2
git clone https://github.com/sepinetam/wcloud-webapp.git
cd wcloud-webapp

下一步创建虚拟环境并安装依赖:

1
2
3
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt

然后就开始到处搜罗该怎么办了,网上最多的方法是nginx、gunicorn、flask三者合体,但是带上这个gunicorn和nginx之后我咋也没部署成功。

省流版————最省事的方案

直接打开80端口

1
2
sudo firewall-cmd --zone=public --add-port=80/tcp --permanent
sudo firewall-cmd --reload

然后修改项目的host和port

1
2
if __name__ == '__main__':
app.run(host='0.0.0.0', port=80)

之后直接运行python文件,然后打开浏览器输入服务器ip即可访问。

一个不错的解决方案

YouTube上找到的一个视频,解决了我的疑问.

后续会把这个东西总结出来的。
已经做出来了,指北

部署的困难

先挖个坑,以后回来填。

小总结

关于文件权限问题

因为是自己的小项目,希望用的人都很友善,所以在做的时候ChatGPT也好,网上的各种文档也好,大多都让我设置007和666权限,但是wcloud.sock文件总是权限出问题,解决方案是直接使用777权限,但这样会存在安全隐患。

1
2
# 假设你在项目的目录下
sudo chmod 777 wcloud.sock

要睡好觉

该说不说,有一个好的睡眠才能做好白天的工作。这点我现在深信不疑,但是总是遭不住熬夜。

最开始,这个项目只是wCloud的时候只用了不到三个小时就写好了,但是优化项目的那段时间没睡好用了好几天的时间来写。然后在做wCloud-WebApp的时候,我花了一周的时间来写这个项目,其中大部分时间是在写前端,因为当时没学过前端,所以很多东西都是现学现用。但是那段时间的睡眠还是蛮不错的,所以效率也是很高,但是在部署的头一天因为发现项目存在一个小bug,彻夜难眠(晚上十一点半完成的项目,测试到十二点发现的bug,最后凌晨三点还没睡着,虽然bug现在(@2024.07.14)还没改好)所以第二天部署的时候效率很低,文档都看不进去。

关于开发者社区

或许是我对这个领域不是很熟悉吧,不知道是不是幻觉————中文的社区确实不如英文的社区。一些问题在中文搜不到解决方案,但是YouTube上的解决方案随便一个都有思路的扩展,至少让我想到了直接修改app.py文件中app.run(host='0.0.0.0', port=80)的host和port参数。

最后的最后

还是多读读书吧,找点书看或许比看视频、问AI来的更有效。

置身事内

《置身事内》是兰小欢老师的一部重要作品,详细探讨了中国经济体制和政策的实际运作。

1. 概述与背景

  • 兰小欢通过对中国经济的深入分析,揭示了政府、市场和企业在经济发展中的相互作用。
  • 书中结合了大量实际案例和数据,展示了中国独特的经济运作模式。

2. 政府与市场的关系

  • 本书详细讨论了政府在经济活动中的角色和影响,特别是在政策制定和执行过程中的作用。
  • 分析了市场机制在资源配置中的效率和局限性,以及政府干预的必要性和合理性。

3. 企业的行为与策略

  • 兰小欢阐述了中国企业在市场环境下的生存和发展策略,包括如何应对政策变化和市场波动。
  • 书中通过具体案例,展示了企业在不同经济形势下的应对措施和调整策略。

4. 经济政策的影响

  • 讨论了各种经济政策(如财政政策、货币政策、产业政策等)对宏观经济和微观经济的影响。
  • 通过实例分析,探讨了政策实施过程中的实际效果和潜在问题。

5. 总结与展望

  • 兰小欢总结了中国经济体制的特点和优势,提出了对未来经济发展的展望和建议。
  • 强调了在全球化背景下,中国经济需要不断改革创新,以应对新的挑战和机遇。

置身事内》通过深入的分析和生动的案例,帮助读者更好地理解中国经济的运行机制和政策影响,是一本对学术研究和实际操作均有重要参考价值的书籍。

——Generated by ChatGPT, 2024-07-14 19:39:18

以上引用内容由ChatGPT生成,后续我会阅读这本书来逐条验证正确与否~

笔记

第一章

“所以体制内简化决策流程的原则之一,就是尽量在能达成共识的最低层级上解决问题。”

NOTES: 但是事实貌似并非如此,很多基层政府不能够很好的解决问题,从而出现“上访”这一现象。一方面是由于干部存在“不做不错”这种心理,另一方面是懒政怠政。

“从黑龙江的瑷珲(今黑河市南)到云南的腾冲之间画一条直线,把国土面积一分为二,东边占了43%的面积却住了94%的人口,而西边占了57%的面积却只住了6%的人口。”

NOTES: 经典的瑷珲腾冲线,在”中国经济发展”课上袁晓燕老师上课提到过好多次。

“上级干预”和“下级自主”
“上有政策,下有对策”

NOTES: 这个解释蛮有意思的。

“凡属事者如客,部署如车,我辈如御,堂司官如骡,鞭之左右而已。”

NOTES: 所以领导是被架空了的?

“2017—2018年两年,不少省份(如辽宁、内蒙古、天津等)主动给GDP数字“挤水分”,幅度惊人,屡见报端。”

NOTES: 但是水分要怎么还原呢?我拿着一个错误的数字该怎么让他变成可用的数字?

“所以研究生称导师为“老板”

NOTES: 但是一些观点表示,是因为导师给发钱,所以叫老板,而不是文章中所提到的导师掌管学生的毕业与否。

“激励相容”

NOTES: 激励相容,根据我对文章的理解就是,如果我是一个学生的导师,我需要发论文才能在学校里继续活下去,学生也需要发论文才能毕业,那么我们都有发论文的需求,但是我没时间去做论文,学生又不会做,我就可以把工作安排给他,让他来做他能做的,我们之间就是合作关系,这样就可以互相激励,互相支持。
感觉有一种分工的逻辑在里面。

摘要

第一次接触《乔布斯传》是去年九月份,当时听一期播客节目在讲Elon Musk让乔布斯传的作者沃尔特·艾萨克森(Walter Isaacson)给他写传记,做客的嘉宾是中信出版社翻译《马斯克传》的人,毕竟Musk一直很有意思的,所以去搜了一下这个作者,发现他写过好多大佬的传记,于是当机立断下单这两本传记。因为一个乔布斯,从只有一台iPhone变成现在集齐了Apple的所有产品。

“Think different.”

— Steve Jobs, Apple “Think Different” advertisement, 1997>

“Because the ones who are crazy enough to think they can change the world, are the ones who do.”

— Apple “Think Different” advertisement, 1997

所以,我打算重读《乔布斯传》,记录一下自己的理解。

乔布斯传

Steve Jobs

前言

Jobs是一个蛮顽固、有想法、反抗又极具个人魅力的人。Apple、NeXT、Pixar每一个都让人感受到他的魅力。

第一章 童年

被遗弃是他和妹妹的宿命,但是这不是他们的使命,或许父母的抛弃和养父母的收养才让Jobs有了之后的Jobs。

养父母待他诚然很好。父亲作为工程师,以及周围的邻居让他从小有了电子的环境。

另一个角度的碎碎念

现实扭曲立场

说实话,Jobs的现实扭曲立场是什么东西我第一遍快看完的时候也没理解是什么东西,是因为他的个人魅力吗?还是因为他的感染力?又或者是他真的能把黑的说成白的?我不知道,但是这次或许会揭开他现实扭曲立场的面纱。

Navigation

Who am I

  • School: Economics of School, Shanghai University
  • Major: Economics
First Header Second Header
Content Cell Content Cell