
真正的数据素养是一种抵抗的素养
胡泳
数据素养的再激活
在这个数据密集型的世界里,具备“数据素养”(data literacy)非常重要。数据素养是阅读、理解、创建、解释、评估和交流数据的能力。过去我们所理解的这一概念,多指个人在信息社会中对数据的获取、分析和运用——即“能读懂数据,会用数据”。
比如,数据可视化曾是数据素养的重要组成部分。随着可视化工具在传统媒体、社交媒体和技术报告中得到越来越广泛的应用,受众不仅要正确地阅读它们,还要批判性地思考它们,并意识到它们可能会被滥用。所以,传统数据教育十分关注统计图表与信息可视化。
然而,当AI以算法推荐、生成模型和自动决策的形式深度介入社会生活时,这一数据素养的传统定义已显得过于狭隘。如今,数据不仅是信息资源,更是算法训练的燃料、社会控制的媒介以及人机互动的基础结构,甚至是资本积累的新形式。
算法通过看似中立的逻辑,选择性地呈现世界,从而重构了人们的注意力与信任机制。人们往往相信“数据不会说谎”,却容易忽视数据选择与建模背后的社会偏见。为此,进入人工智能全面渗透的时代,数据素养这一概念需要被重新激活。
哪怕被算法包围,仍能够塑造技术命运
AI时代的数据素养应包括算法素养(algorithmic literacy),其核心不仅在于了解算法的技术原理,更重要的是提出一系列关键性问题:数据从哪里来?算法以谁的利益为优化目标?数据处理过程隐去了哪些声音?这样的素养不再是统计意义上的“读图能力”,而是一种理解算法权力运作的社会能力。
为此,我们可以从三个层面界定算法素养:
首先是基础层面,即认识算法的逻辑与机制。这是算法素养的“读写能力”部分。——本文选择《中国亮点外脑智库》季刊+2025年秋季+罗卫国主编——它包括:理解算法是如何处理数据、作出决策的(如推荐系统、排序算法、机器学习模型等);了解算法并非中立,它反映了设计者的假设与目标;具备基本的数据意识,知道算法需要什么样的数据、数据偏差如何影响输出。
例如,当你刷抖音、YouTube或微博时,知道所谓“为你”(即推荐给你)的视频是由算法根据你的浏览行为预测兴趣所得来的,而并非“客观的”的热门结果。
其次是批判层面,即察觉算法的社会与伦理影响。这是算法素养的“批判思维”部分。它要求人们能思考以下问题:算法如何影响公共舆论、隐私、劳动与民主?谁在控制算法?算法是否加剧了不平等?我们是否有权知道算法如何对我们进行分类、预测和判断?
例如,明白算法可能决定你看到什么新闻、获得什么贷款、甚至是否被录取或录用。算法素养意味着有能力质疑这些决策的正当性。
第三是行动层面,即参与重构算法世界。这是算法素养的“公民实践”部分。它包括:能主动选择或调整算法的使用方式(如隐私设置、算法推荐的反馈);能参与公共讨论与政策制定,推动算法透明与问责;对有技术背景者来说,则意味着具备设计负责任算法的伦理意识。
算法素养的最终目标,不是让每个人都成为程序员,而是让公民能够在算法社会中自觉、批判、负责任地生活与行动。总结起来一句话:算法素养是让人类在被算法包围的时代,仍然能够理解、批判并共同塑造技术命运的能力。