资源|E-Learning 3.0 MOOC

E-learning 3.0 第五节课的话题是资源(resources)。

内容概要如下:

从早期开始,互联网就将分享的理念和更多消费驱动的内容消费模式进行了对比。新闻网、邮件列表、网站和文件传输服务便于交换想法和信息。

这些早期网络越来越被锁定,人与数据之间曾经无缝的交换被越来越多锁定在付费墙和内容孤岛上。web3 意在很大程度上对抗这个现象,并且互联网上的开发者正研发一种新的基础设施,它将反抗封闭的努力。

这些技术建立在过去文件共享网络的一些基础上,但是增加了凸显它们集中控制和监管弱点的要素。其中一个例子是 IPFS(Interplanetary File System)和它的同类 IPLD(Interplanetary Linked Data)。这些新的文件共享系统不是依靠互联网地址定位内容,而是使用数据或内容的哈希值(hash)作为地址,使数据分布在云端,可以从最便捷的源头访问。

我们已经看到更多传统的内容,例如书籍、媒体和音乐,通过 IPFS 分布。类似的技术正被用于支持更复杂的内容。例如分布式应用(dApps)、订阅、列表、协议网络(contract network),甚至 DAO(decentralized autonomous organization)分布式组织。由于没有中心点,没有任何办法控制这些类型的内容,从而引起对其合法性和漏洞的质疑。

这些概念被用于介绍一种新型开放教育资源(OER,open educational resource)、教育内容可寻址资源(CARE, content addressable resources for education),以及 CARE 和 CARENet 的相关概念。

这些资源可能是从课程和程序到事件访问和录制到上述一些高级学习应用程序的任何内容,将通过内容可寻址网络打包和分发,因此,它们永久开放,不可能被商业服务封闭。由于不变性、哈希寻址过程的特点,确保了创建的内容就是接收到的内容。

教育内容可寻址资源的概念解决了开放教育资源(OER)可持续性问题,因为老师和学习者的分布式网络通过他们的使用来维持它们。

它还创建了将数据、媒体、软件和人连接起来的资源图形的创建机制,重新定义了我们对开放课程(开放教学法)的观点,不是由许可证和机构主导,而是由人和做法主导。

IPFS/Beaker Browswer 安装方法

创建分布式资源网络的工具:IPFS, Beaker Browser, Fritter.

Fritter 是类似 P2P Twitter 的应用程序, 它通过 Dat访问,目前可以使用 Beaker 浏览器打开。

这个视频是关于如何在 Windows 系统安装 IPFS. 如何添加一个网站到 IPFS 可以参考这个视频

安装 Beaker Browser 并创建网站的方法: https://www.youtube.com/watch?v=8pTE4KCzzRc

使用 Dat 分享内容的方法,以 Dweb 为例:https://www.youtube.com/watch?v=8KpqKWMZcIk

Twitter 收藏的各种资源整理

视频类

国际非暴力冲突研究中心(@civilresistance)推出五部精彩的关于非暴力抗争的纪录片,分别是《一种更强大的力量》、《橙色革命》、《推翻独裁者》、《面对真相》、《埃及:被打断的革命?》,并有包括中文在内的20多种语言的配音。请收藏、观看、传播。免费。https://www.nonviolent-conflict.org/icncfilms/ (from @tengbiao)

给各位推荐近期不错的片子 : 解除好友2 :暗网 技术宅大力推荐 磁力magnet:?xt=urn:btih:9BABF843AC5247DB7CBBF46C1D0CC14E04FA1387 (from @886106)

一个新的纪录片推荐 ‘Free Speech, Parler Sans Peur’(后半句的意思是‘毫无恐惧地说话’) 在这里看到更多:https://www.jupiter-films.com/film-free-speech-parler-sans-peur-95.php (from @DonEvansWm)

『最后的棒棒』一口气看完这部纪录片,真是精彩!我喜欢的看点到不是弱势群体,底层惨状,中国梦反差萌…之类表象。而是这片在以真实为基准之上展现的人性与戏剧性,即便是位高权重者,富有者,一样逃不开片中那些真实而连续的人生里的因果循环。https://www.bilibili.com/video/av22517607?from=search&seid=14283108750748647806 (from @tanxinbuzu)

160分钟版芙蓉镇Hibiscus Town.1986.DVD.X264.AAC.HALFCD https://youtu.be/5VL5WPZGVH0 (from @appiredicry)

上周末看完《民主:沉醉在数据中》,这部关于今年5月份实施的GDPR条例出台始末的纪录片,权衡各种政治、司法、经济利益、公民权益的过程挺值得一看的,没记错的话应该也是斯诺登第二次真人出镜。摄制组也是史无前例的获得欧盟的许可,全程纪录下该条例的诞生。 B站德语中字:https://www.bilibili.com/video/av6675249/ … (from @LaoTieNoProblem)

英國另一份重要的知識份子雜誌「倫敦書評」這一期很特別:只有一篇文章,是關於去年Grenfell Tower 大火的反思。網站上有全文,還有一支將近一小時的紀錄片。我可能沒有心力看完,但是對於這個企圖很有興趣 Andrew O’Hagan in the LRB: https://www.lrb.co.uk/v40/n11/andrew-ohagan/the-tower via @LRB (from @soundfury)

“The push for STEM-based education in this country is fierce. It’s in all of our faces. And this is a colossal mistake.” @ericberridge https://www.ted.com/talks/eric_berridge_why_tech_needs_the_humanities (from @TEDTalks)

“We cannot have a society in which, if two people wish to communicate, the only way that can happen is if it’s financed by a third person who wishes to manipulate them.”https://www.ted.com/talks/jaron_lanier_how_we_need_to_remake_the_internet

“As long as my phone is turned on, my location can be tracked.” http://t.ted.com/OZ0DOAn

7 years ago, I talked with @jimmy_wales about collaboration https://www.youtube.com/watch?v=PlFUf-KwYjM&t=5s

数字馆藏类

康奈尔大学的 Macaulay Library,号称全世界最大最久(自1929)的动物叫声资料库(也包括视频资料),收藏了近67%世界鸟类的声音,该大学的鸟类实验室将这批音视频资料进行了数字化并发布:http://macaulaylibrary.org/ 。包括9000物种的15万音频。

中研院歷史語言研究所製作的「近代史數位資料庫」的網站風格太贊了 http://mhdb.mh.sinica.edu.tw/index.php

斯坦福大学图书馆发布了 EarthWorks ——新的GIS数据发现系统,支持多种途径检索和浏览来源于斯坦福大学图书馆及其他机构的GIS数据。 入口:https://earthworks.stanford.edu/

因见人数次提及,很想读一下郭沫若的《读〈随园诗话〉札记》,搜到一册非常清晰的PDF版《郭沫若全集文学编》第十六卷,其中包含了该札记及文艺论集续集:http://memory.scu.edu.cn/UploadFiles/pdf/%E9%83%AD%E6%B2%AB%E8%8B%A5%E5%85%A8%E9%9B%86%E6%96%87%E5%AD%A6%E7%BC%9616.pdf …

“中英文图书数字化国际合作计划(CADAL)”现有成果:7.8万册电子书,中文古籍,600dpi分辨率。 https://archive.org/search.php?query=%28sponsor%3A%22China-America%20Digital%20Academic%20Library%20%28CADAL%29%22%29%20AND%20-mediatype%3Acollection&sort=-avg_rating%3B-num_reviews

10000+ 报纸分布世界地图: http://newspapermap.com 。以颜色区分语种,嗯,汉语被归在了“Other”里。via @newspapermap

一个关于歌川广重木刻浮世绘的网站:http://www.hiroshige.org.uk/index.html 。作品收集得很全,描述清晰。妙的是,创建者是一个既不懂日语也非艺术专业的人,对于何以会做这样一个网站又缄口不言,不禁让人揣想背后的故事。

http://ecoexplorer.arcgis.com/eco/ USGS(美国地址勘探局) 和 Esri(环境系统研究所) 联合制作发布的最详细的高精度(250米)全球生态在线地图工具。

Expedia Viewfinder 数据库最近发布了一个beta版图片库( Expedia Viewfinder Image Library, http://www.expedia.com/pictures/ ),包含4万高清旅游照片,可供创作者们免费使用。嗯,这个横移页面够鲜亮。

为纪念莎士比亚去世400周年,最大最权威的莎士比亚资料在线展览 “Shakespeare Documented” 于1月20日发布,包含与莎士比亚生平与作品相关的图片,抄本,文档,在他生前及去世后不久提及他的各种参考文献等。 http://www.shakespearedocumented.org/

由波音公司赞助,《美国航空周刊与航天技术》(Aviation Week & Space Technology)杂志将其100年来的4500期约50万页内容数字化并免费开放(1916-2016):http://archive.aviationweek.com

WDL 世界数字图书馆 http://www.wdl.org/ 真是太酷了!比如这个世界地图的分类下 http://www.wdl.org/zh/search/?additional_subjects=World%20maps 把各个文明对世界地图如何接纳的历史都呈现出来,而且这些珍贵的原始资料的数字版本都可以自由下载!必须赞!

19世纪被称为书籍插图的黄金时代。“Old Book Illustrations”这个网站扫描了19世纪至20世纪初公有域老书刊的优秀插图,供免费下载:http://www.oldbookillustrations.com/ 。图片高清,按主题、画家分类,可检索题名,质量超赞。

奥斯丁家族收藏的乐谱,有印刷本,有手稿,共18册,目前被南安普顿大学图书馆数字化了,扫描效果很好:https://archive.org/details/austenfamilymusicbooks 。cc 音乐爱好者。

论书籍数字化之精美和不惜成本,莫过于梵蒂冈数字图书馆,现在该网站已经有5300珍稀数字化手稿发布了:http://digi.vatlib.it/

哈佛美术馆制作的包豪斯艺术作品时间线:http://www.harvardartmuseums.org/tour/the-bauhaus/slide/6338 … ;该馆已将约3.2万件包豪斯风格艺术品制作为在线馆藏,可从各种角度检索浏览:http://www.harvardartmuseums.org/collections/special-collections/the-bauhaus …

大英图书馆的“泥金装饰手抄本(Illuminated manuscript)目录”,收录该馆藏中世纪及文艺复兴时期手抄本中的装饰页及其说明,若是搜索及呈现功能更好用些就好了。http://www.bl.uk/catalogues/illuminatedmanuscripts/welcome.htm …

Internet Sacred Text Archive Home,收集关于宗教、神话、传奇、民俗、神秘学等主题的在线电子书库,每种包括英文版,并尽可能提供原文。一个“古老”的网站,1999年就上线了。http://www.sacred-texts.com/index.htm

免費下載佛洛伊德著作的電子書與有聲書 http://bit.ly/23AgkW4

来自彩色玻璃艺术家 Henry Belcher 和他的公司1886年出版的马赛克玻璃目录,真的很美。 http://publicdomainreview.org/collections/catalogue-from-belcher-mosaic-glass-co-1886/ …

大都会艺术博物馆出版的457种艺术书籍于 MetPublications 门户网站免费开放了:http://www.metmuseum.org/art/metpublications/titles-with-full-text-online?searchtype=F … ,可以下载,也可以在 Google Books 上浏览全文。

MIT 媒体实验室与 Deloitte 及 Datawheel 联合开发的数据挖掘与可视化工具:Data USA(http://datausa.io/ )上线,可从各个角度展示与分析美国政府开放数据。

Rgoers 的世界玫瑰月季类百科全书( http://www.rogersroses.com/ ),收录5000种玫瑰,提供6000幅图片帮助辨别种类,网站内容由玫瑰专家 Roger Phillips 和 Dr. Martyn Rix 小心维护编辑。

美国国会图书馆将其数字馆藏中无任何版权限制的高清内容做了个专辑——Free to Use and Reuse Sets:https://www.loc.gov/free-to-use/ ,分若干主题,包括海报、历史照片、资料图片、童书绘本、插画、浮世绘等等。我觉得每个数字馆藏大户都应该把无版权限制内容单列一下。(from @yun_chuang)

芝加哥艺术博物馆将其4.4万+艺术作品的高清资源发布到新版官网上,以CC-0协议开放获取,可任意下载。比较赞的是,每一幅作品都附有详细介绍、作者小传、来源、相关音视频资料、参考文献等。https://www.artic.edu/collection (from @yun_chuang)

科幻百科全书Encyclopedia of Science Fiction:http://www.sf-encyclopedia.com/ ,免费开放,包含17,500余词条。1979年出版的第一版科幻百科曾获1980年非小说类雨果奖。1993年出第二版,1994年又获雨果奖。2011年发布线上版本。现在的是第三版。(from @yun_chuang)

Independent voices,开放获取资源,1951-2016独立/另类/激进出版物数字化集合,包括报纸/杂志/期刊,反战、女权、LGBT、黑人运动等,整合自美国、加拿大、英国多家机构,目前已收集 15,401期。https://voices.revealdigital.com/cgi-bin/independentvoices?a=p&p=home&e=——-en-20–1–txt-txIN—————1 … (from @yun_chuang)

普林斯顿大学图书馆数字化项目:30幅中国辛亥革命时期稀见木刻版画,高清。http://pudl.princeton.edu/collections/pudl0030 (from @yun_chuang)

Chine Ancienne,一个关于中国历史习俗宗教圣贤艺术文学等的法文数字图书馆。公有域,免费下载(pdf/doc)。看起来像是个人所建,主人引了句名言:“当你沉浸在中国人的世界,你不能走了!”(Quand vous serez plongé dans l’univers chinois, vous n’en sortirez plus !)https://www.chineancienne.fr/

芝加哥大学出版社2018新版美国史教科书:Building the American Republic 全文免费阅读下载 http://press.uchicago.edu/sites/buildingtheamericanrepublic/index.html … (from @ideobook)

普林斯頓大學葛思德東亞圖書館还有一个皮影形象数据库(Chinese Shadow Figures Catalog):https://library.princeton.edu/eastasian/shadowfigures/index.php?pageNum_Shadow=0&totalRows_Shadow=2264&search= …

首都博物馆古籍插图图像数据库 http://query.clcn.net.cn/GJAndST/gjct1.htm …,包含古籍插图数据一万条。用到的3次中有1次帮上了忙。这些插图从首图馆藏古籍文献中拣选制作,每条包括插图全文影像和内容标引。可惜图片精度不高,内容揭示也比较粗糙,范围仅限一馆之藏,未免狭窄些。真的应该有一个更大更精更博的插图库啊。

这个很好玩:国际日本文化研究中心的妖怪画像数据库 http://www.nichibun.ac.jp/YoukaiGazou/index.html … ,可按名字和特征检索。

推荐一个偶遇的网站:漢語多功能字庫:古文字繫形、形義通解、英漢索引、粵語審音配詞。 http://humanum.arts.cuhk.edu.hk/Lexis/lexi-mf/ 香港中文大學人文電算研究中心建设,共收錄逾13800字,其中1060字有甲骨文,2059字有金文,1087字有簡帛文字,960字有其他古文字,7271字小篆等。页面布局利用率很高。

《中国历史地图集》全八册在线公开 http://www.ccamc.co/chinese_historical_map/index.php …

生态学鼻祖 Ernst Haeckel (恩斯特·海克尔)1904年初版 Kunstformen der Natur (Artforms of nature,自然的艺术形态) 中的100幅精美插画,高清图片在维基共享资源中(https://commons.wikimedia.org/wiki/Kunstformen_der_Natur … ),有人做成了顺滑缩放版:http://algorithmic-worlds.net/Haeckel/haeckel.php …

大英图书馆新上线子网站,发布了数字化的1300珍贵希伯来手抄本,支持希伯来文与英文双语检索。好华丽。British Library publishes treasure trove of Hebrew manuscripts https://www.timesofisrael.com/british-library-publishes-treasure-trove-of-hebrew-manuscripts/?utm_source=dlvr.it&utm_medium=twitter …

费城伯恩斯美术馆最近数字化2000+印象派、后印象派及早期现代杰作(约为其馆藏一半),并免费开放:https://collection.barnesfoundation.org/ ,其中1429幅可下载高分辨率图片。

著名学术出版社 De Gruyter 最近发布了一个新网站 Science Discoveries ,用来展示科研方面的最新进展,主要聚焦于医学,健康,环境,技术,生物等领域。https://sciencediscoveries.degruyter.com/

汉籍电子书库(漢リポ Kanseki Repository) :https://www.kanripo.org/ 。日本人做的汉籍库,分经史子集道佛六类。经史子集以文渊阁四库全书为本,文本与影印页面对照,可全文搜索。开发托管于GitHub,已上传古籍9040种。

史密森尼艺术博物馆将其20万件藏品数字化,令3000年设计史可在线浏览:https://collection.cooperhewitt.org/ http://www.openculture.com/2017/09/the-smithsonian-design-museum-digitizes-200000-objects.html … 来自 @openculture

Google Arts & Culture 新创建的项目“We Wear Culture”,集成了40个国家的时尚、纺织、服装艺术数字资源,跨越3000年历史,包括一些华丽的全景展示,看起来很有趣。https://artsandculture.google.com/project/fashion

国图网络注册用户可远程访问的电子资源越来越多,包括古籍数字善本、民国图书、东京大学东洋文化研究所汉籍影像、宋人文集、国际善本联合目录及大量外文数据库资源等。所以整理了关于国图网络用户注册、权限、资源等系列问题,如果有人需要:https://workflowy.com/s/2Xwnb9s7Ve

台湾华文电子书库Taiwan eBook启用上线,电子书1万3,778册,包括1911-1949年图书1万2,178册、政府出版品595册、百人千书1,005册,免费开放读者线上阅览利用(无需翻墙,但首次打开速度较慢 http://taiwanebook.ncl.edu.tw/zh-tw

技术/工具类

这个名为Everything的本地全盘搜索工具好用,有绿色便携版,中文语言包,推荐。 http://www.voidtools.com/

EpubPress 實測後完全可用。將多個瀏覽器分頁的內容整合成一本電子書;除了下載檔案外,還可以勾選格式與電郵,直接寄送給 Kindle 與多看,一分鐘就收到而且格式呈現也不錯。 https://bookfere.com/post/565.html

Debian/Ubuntu 系统下有个名为 gdebi 的软件包,可以自动解决安装的deb软件包时的依赖问题。https://packages.debian.org/search?searchon=names&keywords=gdebi (from @chenshaoju)

自学式手册《数字安全实用手册》的网站http://practicaldigitalprotection.com

保护 SSH 端口的多种方法:http://www.hackingarticles.in/multiple-ways-to-secure-ssh-port/ (from @APTp0)

让 YouTube 实现双语字幕的 Chrome 扩展。https://github.com/muzuiget/dualsub-supports (from @muzuiget)

「理解数字世界中的纸张|PDF 科普」:https://sspai.com/post/47092 (from @AlanDecode)

Arctime 是一个全新理念的可视化字幕创作软件,可以运行在Mac、Windows、Linux上。精准的音频波形图,可以快速创建和编辑时间轴,可以高效的进行文本编辑、翻译。支持SRT、ASS外挂字幕格式,并可以通过交换工程文件或与伙伴协同工作。字幕编辑完成后,需单击“视频转码”按钮,即可轻松完成字幕压制工作。

发现一个很有用的工具网站,把可执行文件传上去,立刻用65种反病毒软件扫描一遍,更棒的是在Behavior页里有此程序在两种沙盒里的行为表现,简直通透。 同时还可以扫描URL。 推荐 网站:https://www.virustotal.com (from ZeaIYi)

Anbox 是一个 Linux 系统运行安卓应用的容器,理论上把安卓应用安装在任何 Linux 系统,但是目前只支持 Ubuntu。https://anbox.io/ (from @ruanyf)

科学上网指南——Wireguard:https://eddyemma.com/blog/2018/08/26/科学上网指南-wireguard/ (from @zhang_cong) https://doub.io

前两天开源的《计算机网络:系统方法》,我做成电子书了,后面网址下载。https://github.com/ruanyf/book-computer-networks (from @ruanyf)

Docker 是个划时代的开源项目,它彻底释放了计算虚拟化的威力,极大提高了应用的维护效率,降低了云计算应用开发的成本!使用 Docker,可以让应用的部署、测试和分发都变得前所未有的高效和轻松!Docker](https://twitter.com/hashtag/Docker?src=hash) 入门教程在这里。https://github.com/yeasy/docker_practice/blob/master/SUMMARY.md (from @huangjinbo)

2018年信息安全从业者书单推荐,重得阅读一下。https://github.com/riusksk/secbook (from @huangjinbo)

做了一个颜色预览以及配色生成工具 Colorless,可以实时预览 iOS/Android/Web 的配色效果。https://colorless.app/ 我以前很长时间内都不知道如何使用颜色,看了很多关于色彩的书和文章后,还是决定用算法来计算颜色,而不是用我的艺术思维去创作。然后今天把我积攒的方法论做成了一个工具。(from @waylybaye)

Data Miner 真的是爬網頁資料的神器。不需要寫程式,略摸一下 jQuery Selector 的規則多試幾次就好;選擇好資料欄位、自動翻頁繼續抓、甚至用簡單 JS 清理分割一下資料,都在 Chrome 裡完成,萬用。https://data-miner.io/ (from @wastemobile)

微软的团队协作工具 Teams 推出免费版了,可以聊天、视频、上传文件、内部集成了 Office。https://products.office.com/en-us/microsoft-teams/group-chat-software (from @ruanyf)

Editoria 是 Coko 替加利福尼亞大學出版社開發的線上出版系統,由好幾個同樣是他們開發的開源組件特調而來,功能與流程都非常紮實,編輯與作者協作、紀錄變更、編注都有;輸出 EPUB 與 IDML 都在開發計畫線上。 [https://editoria.pub/]https://editoria.pub/) GitLab https://gitlab.coko.foundation/editoria/editoria (from @wastemobile)

安全手册:这里是你需要的几乎所有安全上网工具;以及为什么建议不要使用以美国为基地的网络服务; 为什么Win10 是隐私噩梦? privacy https://steemit.com/life/@iyouport/7nfymr

《Linux 就该这么学》PDF 版本官方下载地址:https://www.linuxprobe.com/book (注意需要关注微信公众号)。 (from @huangjinbo)

自动生成背景图片的工具网站,现在提供五种风格,每种都可以定制,看上去赏心悦目。https://coolbackgrounds.io (from @ruanyf)

Android 手機畫面投影 Windows 10 免接線、免 App、免網路 https://www.playpcesor.com/2018/05/android-windows-10-miracast.html (from @esorhjy)

对于Windows用户,如果需要彻底清除U盘或硬盘,且不想使用第三方软件的,可使用 format X: /p:Y 命令,其中 X 为需要格式化的盘符, Y 为清零的复写次数,建议不低于三次。如果要更加安全可靠的清除,可使用开源免费的Eraser软件: https://eraser.heidi.ie (from @chenshaoju)

如何恢复被删除的微信聊天记录 https://www.solidot.org/story?sid=56338 //光卸载微信是没用的,真正要彻底清理的话(Android),要么Root手机用dd命令擦除userdata分区,要么卸载微信,删除 /sdcard/tencent 目录后用第三方App复写存储空闲区域: https://play.google.com/store/apps/details?id=xyz.rodit.fshred (from @chenshaoju)

https://www.portablefreeware.com/all.php Portable Freeware Collection 如果要找一些Windows的小软件的话,这个网站挺不错的。(from @cathayan)

装了 iNaturalist(一个自然观察与物种记录网站)的物种识别 App(https://www.inaturalist.org/pages/seek_app ),通杀动物植物真菌界,且看其效果如何。——其实我这个脸盲症患者不是更需要人脸识别应用吗? (from @yun_chuang)

想学 Markdown?这篇文章帮你快速上手 http://sspai.com/post/43866

根据 VPN Leak 这篇文章的介绍,即便使用 VPN,在浏览器启用 WebRTC 的情况下,用户的真实 IP 仍然有可能被泄漏。要检测你的真实 IP 是否被泄漏,可访问:https://ip.voidsec.com (https://voidsec.com/vpn-leak/ ) (from @linuxtoy)

凑巧发现了Cloud Torrent这款开源软件,试了一下,发现效果意外的不错,功能: BT下载 磁力链接下载 上传BT文件 离线下载 边下边播 面板操作 文件会离线下载存储到VPS上,然后你可以下载到电脑本地… 软件地址:https://github.com/jpillora/cloud-torrent … Doubi一键脚本: https://doub.io/wlzy-12/ 个人建议安装原版 (from @CrazyJal)

两个很好的初学者教程:《四分钟学 CSS》 https://jgthms.com/web-design-in-4-minutes/ … 《十四分钟学 JavaScript》 https://jgthms.com/javascript-in-14-minutes/ (from @ruanyf)

有興趣的可以試試 BookFusion 電子書管理服務(免費) https://www.bookfusion.com 不管 ePub 或 mobi,拖進視窗就可上傳、集中管理;設定好 Send to Kindle 電郵之後就可自由傳送,它會自動轉換格式(這點很棒)。中文沒問題,Android 閱讀軟體比 iOS 的好,劃線註記功能也都有。

CSS 垂直居中的最简单写法:容器元素设为 flex 布局,子元素只要写 margin: auto 即可。

1
2
3
4
5
6
7
8
9
10
11
<header>
<h1>A secret weapon..</h1>
</header>

header {
display: flex;
height: 100vh;
}
h1 {
margin: auto;
}

LightPDF 線上轉檔Word、編輯 PDF,免費無檔案大小時長限制 http://www.playpcesor.com/2018/02/lightpdf-word-pdf.html

一个可以让你下载20多个网站视频的网站,不需要什么插件与客户端,只要播放地址既可以给你真实下载地址,绝对值得收藏。什么YouTube.Facebook.汤不热上的视都不是事。https://savieo.com

The Greek Alphabet - Cheat sheet for reading formulas in Machine Learning, Economics, and Finance. 附:如何在 Ubuntu Linux 下用 ppmtopdf 将PDF转换为图片 http://t.cn/RRrZBzG

那个可以获取「学术论文」的 SciHub 进化 3.0 版本,拥有了易用的图形界面 http://ift.tt/2mLe6aK

最近看的两篇和 iCloud 有关的文章:《科普:进一步了解 iCloud「照片」、「照片图库」和「照片流」》 https://sspai.com/post/31553 和《不想停用 iCloud?不妨迁移数据到其它 Apple ID》 https://sspai.com/post/42766 可以说少数派真的汇集了中文圈最优秀的相关领域作者了,比 Apple 官方文档写得还详细。

Self-hosted Server 新增 Web 应用:Lychee。Lychee 是一个好看又好用的照片管理工具,包括专辑归类、与朋友分享、选择是否公开/私有、支持 EXIF/IPTC 元数据、导入等不错的功能。(https://selfhostedserver.com/features / https://lychee.electerious.com)

你遇见过网页由于要下载字体,导致内容一片空白吗? CSS 现在有一个新属性 font-display,可以解决这个问题,从而可以放心地在网页加载字体了。 https://font-display.glitch.me/

【可视化小百科+工具箱】Google News Lab与一家可视化制作公司Adioma合作,将市面上出现的所有可视化都进行了分类:图表、相关书籍和工具。读者们可以在这个小宇宙页面上,看到三大类代表的星球独立自转,简洁明了,奇趣又美观。https://buff.ly/2AlLzgI

【不会编程,也可轻松学地图可视化】CartoDB是一款开源网络应用程序和交互式地图制作工具,以提供“一键式制图”功能闻名。起初CartoDB和数据新闻相差千里,是两名西班牙研究生物多样性和自然保护的科学家为了更好展示研究成果而建立的。https://buff.ly/2CovJ6e

Git In Practice:面向中到高级用户的 Git 图书,原由 Manning 出版,现由作者开源到 GitHub 供免费阅读。(https://github.com/GitInPractice/GitInPractice)

小知识 很多人不知道 text-decoration-color 和 text-decoration-style,可以设置下划线的颜色和样式。(来自@AllThingsSmitty

1
2
3
a:link {
text-decoration: green wavy underline;
}

如果你还在使用 tinypng 压缩 PNG 图片,可以考虑改用 upng。它的压缩率更好,还可以调节图片清晰度,换取更小的体积。http://upng.photopea.com/

【ProPublica数据学院】自Propublica数据学院开办两年以来,已有千余人报名参加,每年平均录取12人。无法参与实体课堂也没关系,学院录制了5门课的教学视频,分别是编程基础、网站运作、HTML、CSS基础和进阶。教学链接:https://buff.ly/2z33sDu

网课类

OpenCourseWare是MIT麻省理工学院在2002年发起的公开课项目,旨在向全世界的学生和教育工作者提供免费的在线课程和教材下载等,许多课程还附现场视频讲解,非常不错的项目,对于学习各类知识都有帮助。 网址链接 https://ocw.mit.edu/index.htm (from @GavinLeely)

其它

一些开放的 Trello:https://trello.com/b/Ke3fB31A/skoryxs-art-queue (from @ooof)

推荐一本英文的数学教材《进入纯数学》,免费下载。 从简单的自然数讲起,包括代数、数论、集合、概率和微积分等章节。我觉得,至少对于了解数学的符号体系很有好处。https://infinitedescent.xyz/ (from ruanyf)

有人收集了一份书单,推荐各个领域的经典教科书 https://www.lesswrong.com/posts/xg3hXCYQPJkwHyik2/the-best-textbooks-on-every-subject … (算法方面推荐了算法导论,我还是更推荐 Sedgwick 的那本)(from @zellux)

后知后觉,才发现 Adobe 旗下的全球创意设计类作品聚合平台 Behance, 多种语言支持,多数作品遵循CC协议,允许非商业使用(当然要保留署名说明出处),找素材好去处:https://www.behance.net/ (from @yun_chuang)

MeeToo in China 前段时间公益行业性暴力事件频发,鑑於较少有专业的机构和师资能开展性骚扰专题方面的培訓,性教育機構玛丽斯特普查阅资料并根据机构内部的制度作了一个培训方案,並面向社會提供免費下载:http://www.mariestopes.org.cn/xizai/download.php?class2=157 (from @agaguk)

最新一期的Foreign Affairs值得收藏。 以“互联网之战”(World War Web)为主题编录的系列文章讨论了中国成为互联网大国对世界的威胁和影响、印度网络事业的独特发展道路、欧洲对互联网个人数据和隐私的管控、美国社交媒体对民主选举的影响、大型科技公司的商业和社会责任等。https://www.foreignaffairs.com/articles/2018-08-14/world-war-web (from @kuriko_c)

What do we know about the autism brain? Brain tissue research made these findings possible. To learn more about the latest findings on the autism brain, visit http://takesbrains.org/signup to sign up for the Autism BrainNet newsletter. (from @AutismBrainNet)

为了尽可能地打造一个信息透明、多元化且高水平的产品技术团队,我编写了、并会发给部门内每个新人一份《丁宇的共事指南》,也就是所谓的“Manager Readme”:https://drive.google.com/file/d/12e7WwZSm1RUiiO2C3JhLKEnFgW_IOSIE/view (from @felixding)

偶遇一个个人创办的电子书分享网站:周读,每种书通过百度网盘分享,提供Kindle电子书及txt、pdf、epub格式,书籍种类较杂,有新有旧,排版质朴。可用来救急。http://www.ireadweek.com/index.php/Index/index.html (from @yun_chuang)

800亿像素城市摄影系列,目前已经发布的城市: 北京:https://www.sigoo.com/beijing-skyline-360-panorama-on-central-radio-tv-tower … 广州:https://www.sigoo.com/guangzhou-tower-80-gigapixels-panorama … 天津:https://www.sigoo.com/tianjing-360-panorama-on-tianjing-tv-tower … 郑州:https://www.sigoo.com/zhengzhou-360-panorama-on-qianxi-plaza … 哈尔滨:https://www.sigoo.com/harbin-360-panorama-in-the-winter … 石家庄:https://www.sigoo.com/shijiazhuang-360-panorama-on-tv-tower … 贵阳:https://www.sigoo.com/guiyang-360-panorama-on-dongshan … (from @chenymail)

一些分辨率术语的含义 - 720p: 1280 x 720, 称为 HD - 1080p: 1920 x 1080, 称为 FULL HD - 1440p: 2560 x 1440, 称为 QHD 或 Quad HD,即4倍的HD - 2160p: 3840 x 2160, 称为 4K - 4320p: 7680 x 4320, 称为 8K https://medium.com/@yashwate07/explained-1-display-resolution-11a67a6096c (from @ruanyf)

香港中文大学的《二十一世纪》杂志,原来都已经可以网上免费阅读了。。幸福。。 每一期都有很多好看的文章,创刊三十年积累了很多优秀文章,中文世界里相当优秀的杂志了。http://www.cuhk.edu.hk/ics/21c/zh/issues/index.html (from @wuyagege)

@JZ周峻纬 http://www.comh.ca/antidepressant-skills/adult/resources/index-asw.cfm 《抑郁自我护理手册》,为那些没有条件寻求心理干预的人准备。 BIlsker教授几十年行医经验和科研结果的总结,专门为非专业人士准备,避免了使用专业词汇和生僻词语。 点开后找到Chinese simplified就可以打开简体中文版。以上资源免费,已通过作者本人授权。(from @knifepoint)

I wrote this in 2010 about attention & other 21st century literacies; I’m usually around 10 yrs too early, so it’s about right for now:https://er.educause.edu/articles/2010/10/attention-and-other-21stcentury-social-media-literacies (from @hrheingold)

中文版《独裁者手册》之和谐手册:https://kesalin.github.io/blog/2015/03/26/miss-of-the-dictatos-handbook

網路大數據與個人隱私自決 from Medium http://bit.ly/2puqBch 但主要是想推這本報告《Network of Control:A Report on Corporate Surveillance, Digital Tracking, Big Data & Privacy》,跟著文內連結可以下載免費英文全文 PDF。

四个简单方法,从今天开始戒糖: https://cn.nytimes.com/health/20180320/4-easy-ways-to-cut-down-your-sugar-intake

新加坡居然登记了每一棵树,目前全国共有56万4266棵树。 而且,还可以下载 JSON 文件,里面是每棵树的坐标、年龄、生长速度等数据。(via @cheeaunhttps://www1.nparks.gov.sg/trees

Learn-Anything 這網站很有趣、野心很大,希望讓有心想自學任何知識的人,都能搜尋獲得「學習路徑」,那些有前後關聯或必要性,甚至不會出現在一般搜尋引擎的資源。 https://learn-anything.xyz (from @wastemobile)

【如何均衡媒体饮食】每天平均12小时媒体摄入量:尽可能多的从书籍等摄取提升自己的养分;3小时阅读好的报纸陶冶性情;2小时看剧打游戏;1小时处理邮件等人际关系;半小时处理刷社交媒体;避免虚假内容 https://wanqu.co/p/6307

推荐一本开源电子书《图说 Hadoop》,介绍最流行的大数据管理工具 Hadoop,面向新手,使用卡通图画介绍入门的基本概念。原文是英文,但非常浅显,很好懂。http://hadoopilluminated.com/

大连理工大学出版社下载中心,可以下载到他们出版的各种教材的相关课件、音视频等资料,不管有没有买过书:http://dutp.dlut.edu.cn/xgxz1/MP3ykjxzzx.htm

《默克诊疗手册》,在美加以外地区称为《默沙东诊疗手册》,是世界上使用最广泛的医学信息资源之一。 本手册致力于到 2020 年向各大洲高达 30 亿卫生保健专业人员和病人提供当前最佳的医学信息。https://www.msdmanuals.cn

一个超酷的网站!!!!! http://stars.chromeexperiments.com/ 刚进去看到loading the galaxy我心就开始怦怦跳了!!! 真的要看啊超酷超酷!

由于中国政府并未公布工人罢工和抗争的官方统计数字,中国劳工通讯的工人集体行动地图 @bagongditu 是公众唯一能够查阅的数据库。自2011年起,地图以中英双语收录了近10000宗工人集体行动的详细资料 http://maps.clb.org.hk/strikes/zh-cn

居然有人真的做出了博尔赫斯笔下的《通天塔图书馆》,可以搜索、也可以一页一页看。 https://libraryofbabel.info/

Yale大学有个很有趣的地理经济学(GEcon)的数据库:http://gecon.yale.edu ,展示了一个国家每个地区经济水平分布图。可以看到,每一个国家的GDP基本都是集中在几个大城市(都市圈)。如果再和推特的话唠城市做一个对比,估计可以得到一些很有趣的结论~

又发现一个杀时间网站:http://brainden.com/ ,包含各种有趣的英文谜语,逻辑题,智力游戏,脑筋急转弯等。

上海图书馆新发布的家谱知识服务平台“华人家谱总目”(http://jp.library.sh.cn/ ),提供基于人、地、时、事、堂号多维分面浏览检索家谱信息,并以可交互时间轴、地图展示某姓氏在某一地理空间分布情况。该家谱知识库的元数据也以关联数据形式开放,提供API接口。

学术界海盗湾Sci-Hub,2011年哈萨克斯坦女大学生 Alexandra Elbakyan 所建,旨在去除所有学术障碍,免费提供4千7百万论文获取,去年被Elsevier起诉,网站关了开,开了关,一度移入暗网。现在的域名是:http://sci-hub.io/

美国英语与英国英语的词汇差异 http://themindcircle.com/british-vs-american-english-differences/

很赞的网站:Wireless Philosophy,简称 Wi-Phi ,一个开放的哲学网站,致力于以轻松有趣的动画形式阐释哲学问题及哲学思维方式。建于2013年,现在已经有105个哲学动画上线了。 http://www.wi-phi.com/

GPlates Portal 首次发布了可交互的3D数字化世界海底地图:http://portal.gplates.org/#SEAFLOOR 。赞。由悉尼大学的一个研究团队制作。

密码安全|《隐身的艺术》第一章摘要

THe Art of the Invisibility: the world's most famous hacker teaches you how to be safe in the age of big brother and big data

The Art of the Invisibility: the world’s most famous hacker teaches you how to be safe in the age of big brother and big data

(从英文版出版社得知,这本书的中译本将由湛卢文化出版,期待!)

延伸阅读文章:


密码

我们使用密码存在的安全问题是:

  • 密码字符过短;

  • 相同密码在不同账户重复使用;

  • 密码中含有账户名/个人真实属性信息。

对应的策略有 5 点,具体的介绍在下面:

  • 增加密码字符长度。

  • 使用密码管理器(例如 1Password、LastPass)给使用的每个网站设置随机、唯一的密码。

  • 尽可能的启用双重身份验证(2FA),二次验证登录者身份。通常是通过手机短信、邮件、Authentication App 获取随机验证码。在网站 https://turnon2fa.com 可以查看到如何启用 2FA.

  • 给密码管理器设置一个安全、容易记住的管理密码,并打开 2FA, 保存好备份代码。

  • 复杂规则密码的更好替代方法是不使用已经被破坏泄漏的密码。

EPPB(Elcomsoft Phone Password Breaker)的目的是使执法机构、政府机构获取 iCloud 账户的软件,并且可以公开销售。

为了保护你的 iCloud 和其它在线账户,必须设置一个强密码。

除了工作相关的密码之外,还有那些可以保护大部分个人账户的密码。选择一个难以猜测出来的密码,并不能避免 oclHashcat 这类黑客工具可能攻破你的密码,但是它可以使破译过程变慢,使得攻击者转向更容易的目标。

我们可以合理猜想,在 2015 年 7 月的 Ashley Madison 黑客事件中,暴露出来的一些密码肯定正在被用于其它地方,包括银行账户、甚至工作电脑。在公布在网上的 110,000,00 个 Ashley Madison 密码中,最常见的是「123456」「12345」「password」「DEFAULT」「123456789」「qwerty」「12345678」「abc123」「1234567」。如果你看见你自己的密码有上述这些,你很可能容易受到数据破坏。

Pwned 安全检查

邮箱账户

可以在网站 https://www.haveibeenpwned.com 检查你的邮箱账户信息是否出现过泄漏。

Selection_005

邮箱账户没有发生过泄漏

Selection_007

邮箱账户在 3 个网站发生过泄漏

Selection_008

邮箱账户发生泄漏的详细说明

密码暴露

https://haveibeenpwned.com/Passwords 可以检查密码是否已经在数据泄漏中暴露,如果显示红色背景的以下信息,说明查询的密码已经不能再使用了。

Selection_002

如果显示结果是 Good news–no pwnage found!,也只是表示这个密码在密码泄漏库中没有,但并不表示它是强密码。

Selection_003

在延伸阅读《开发者如何错误地使用密码》文章中提到了 Troy Hunt, 他是澳大利亚微软区域总监兼微软开发者安全专家。从 2011 年开始参与微软社区里的网络安全问题。他参与的重要项目之一就是 Have I been pwned,这是一项免费服务,收集了数据泄漏,帮助网民确认他们是否受到了网络恶意行为的影响。

在 21 世纪,我们可以做得更好,也就是用字母和数字组合的更长、更复杂的密码。以下是自动、手动两种作法。

自动管理密码:使用密码管理器

最简单的方式是放弃创建你自己的密码,使用简单的自动化生成。有若干数字密码管理工具。它们不仅可以把密码存储在一个加密的金库里,当你需要密码的时候也允许一键获取,密码管理工具还可以为每个网站生成新的强、独特的密码。

使用密码管理器会有两个问题。

  • 其一,密码管理器使用一个管理员密码来获得其它密码。如果有人碰巧使用恶意软件感染了你的电脑,当恶意软件记录每次按键输入,会盗取密码数据和管理员密码。这下就完蛋了!黑客会利用密码管理软件的后门获取密码。

  • 其二,如果你丢失了管理员密码,意味着你丢了所有密码。最终,即使你可以重置每个密码,但如果有大量账户,这将会是一个很大的工作量。

尽管存在这些缺点,但下列小技巧应该足够保证密码安全。

  1. 强密码口令(短语),而不是密码,应该足够长,至少 20-25 字符。 随机字符的作用最好,但人类大脑难以记住随机序列。所以需要使用一个密码管理工具。推荐使用开源的密码管理工具,只在你的电脑本地存储数据,例如 Password Safe、KeePass.

  2. 对两个不同的帐号,从不使用相同的密码。 密码管理工具可以生成和存储强而唯一的密码。

在延伸阅读中提到,从 20 世纪 70 年代开始考虑安全存储密码,经过了使用哈希处理、BCrypt 算法处理密码,算法处理已经来不及抵挡强制破解密码,再加上很多网站还没有限制连续重复登录请求、使用验证码的情况下,要求用户在设置密码的时候遵守「至少只用数字、标点符号」这类复杂规则,并没有帮助解决密码重复使用、密码弱、将个人信息输入密码的问题

手动创建并写下密码

  1. 用纸写下密码,不要直接把账户、密码全部写出来,例如:中国银行:3sto7ghendp1vbs*.
  2. 用隐晦的词汇代替账户,密码只写一部分

密码保护之外的设备保护

不要轻易随便与别人共享帐号密码。

除了密码保护在线服务,也应该用密码保护个人设备(电脑、手机、平板等),需要设置一个开机密码或者屏保密码。

三种常见的给手机(Android/iOS/其它类型)加锁方法

  1. passcode:最常见的一种方式,以特别的顺序输入的一连串数字

    1. 不要用手机号码里的数字设置
    2. 有些设备也支持 text-based passcode , 字母与数字混合
  2. 另一种是 visual
    Android:Android lock patterns:140704 种组合
    alps

  3. 第三种:biometrics 指纹解锁,人脸识别

建议 Biometrics 和 passcode 结合使用。

E-Learning 3.0 MOOC 之 图表

第三课 Graph 链接:https://el30.mooc.ca/cgi-bin/page.cgi?module=7

课程概要

图表(Graph)是 web3 网络的概念性基础,这个概念对于研究「连接主义」(Connectivism)的人来说很熟悉,因为连接主义的观点是知识由网络中节点的关系组成,换句话说,知识是一种图表(不是讲述一连串事实和结构)。

图表,尤其动态图表有特别的属性,其结果可以在社交网络理论、现代人工智能、经济和政治理论中找到。

以前在互联网上,有关图表的工作与图表的语义有关。例如我们说像语义网(semantic web)和信任网络(Web of Trust, WOT)的发展。这些都是有限的成功。在 web3 中,节点之间的连接(「边」)是使用密码学创建的,因此创建了具有不腐败连接(incorruptible connections)的链或者树。

about Semantic web :
https://www.w3.org/standards/semanticweb/

https://zh.wikipedia.org/wiki/语义网

其中一个例子是梅克尔树(Merkle Tree),树枝包含叶子的哈希,树干包含树枝的哈希。图表——例如有向无环图(Directed Acyclic Graph) 可以这种方式创建。

我们可以使用这些技术已经建立的的数据结构,创建一种新型内容。一个著名的例子是比特币,它基于块环链的交易记录,本质上是一个已有链。另一个例子是存储在 GitHub 上的软件更新版本的集合,GitHub 使用 DAGs 管理版本控制和软件复制。归属网络、概念网络、网站,所有这些都可以用图表来表示。

在连接主义中,我们探讨过将知识视为图、将学习视为图表的增长和操作的思想。它帮助学习者理解每个想法与另一个的关系,重要的不是个人观点,而是整个图表如何增长和发展。

它帮助我们理解图表——甚至知识——不仅是一个表象系统,还是一个感知系统,图表不仅是仓库,还是一个由周围环境塑造的增长型、动态实体。

图表和图表理论以一种具体的方式展示每个事物如何依靠其它事物,并且帮助我们把对自己的理解、知识、工作放在一个更广阔的背景下。哈希图通过列举克隆、仿造、版本控制、合并,进一步说明了基本的知识创造机制。


Ben Werdmuller 认为区块链技术并不是完全匿名,可以从元数据(metadata)分析出发布信息、交易双方的身份,包括应用在安全聊天软件中,它只是让推断分析真实身份更加难。metada makes something open.

Indieweb:用户应该能够从您自己的网站分享,讨论和发布,最好是从您自己的域名中分享,不受任何单一公司的负面控制,现在大多数对话和大部分话语都是发生在网络上以及由极少数非常富有的公司如Facebook,Twitter和Linkedln所拥有的空间中。

Unlock:直接连接读者与作者。

使用 Facebook 時,應該考慮什么?

原文:https://veekaybee.github.io/2017/02/01/facebook-is-collecting-this/

winnower.jpg
Courbet, The Winnowers

摘要:Facebook 通過眾多渠道使用數百種方法收集有關你的數據。你很難退出,但通過了解他們收集的內容,可以認識到 Facebook 平台的危險性,并選擇以更嚴格的限制來使用 Facebook.

目錄:

Facebook 無論好壞,已經成為我們的網絡客廳、第三空間。這是我們與好友交談、發布新聞、組織活動、悼念逝者、慶祝嬰兒出生、訂婚、找新工作、展示新發型和假期的地方。

Facebook 平台已經占據了如此大的占有率,并且開始作為我們的冥想盆。因此,了解 Facebook 公司獲取使用我們的希望、夢想、政治宣言、嬰兒照片信息做什么尤為重要。

從獲取數據開始。2014年,Facebook 工程師寫到他們每天可以獲取大約 600TB 的數據

對比一下,《戰爭與和平》的文本大小是3.1MB;1966年的蘇聯版《戰爭與和平》電影時長7小時,大小是8GB

因此,人們每天上傳的數據總量相當於1.93億本《戰爭與和平》書籍、75,000部《戰爭與和平》電影。

Facebook 數據政策 概述了它收集的內容和如何處理數據。然而,和大多數公司一樣,Facebook 忽視了實際要點,沒有告訴用戶到底發生會什么。

我揣測自己寫每條狀態更新時的按鍵,使我感到沮喪,對此決定做一些研究。以下所有信息來自科技商業新聞報導、學朮出版物、我作為 Facebook 用戶能夠在客戶端看到的內容。作為一名從事用戶數據工作10年以上的專家,我在這篇文章中加入了自己的詮釋。

如果任何一位 Facebook 員工想要對此篇文章進行糾正,我會很樂意聽他們說并沒有像下文所說的那樣收集和處理用戶數據。

Facebook 如何收集數據

為了理解 Facebook 數據收集的工作原理,我繪制了一個(非常非常)簡單的圖表。用戶將數據輸入用戶界面(應用程序),這是前端。

這些數據隨后被收集到 Facebook 的數據庫(這些數據庫有很多),這是后台。

用戶在前端看到的數據是后台數據的子集。

facebookui.png

如果你對更多的技朮規格感興趣,Google 上面有很多架搆圖。Facebook 正處在處理大數據的前沿,它們的堆棧包括 Hive, Hadoop, HBase, BigPipe, MySQL, Memcached, Thrift 更多。所有這些都存放在許多大型數據中心,比如 Prineville Oregon 數據中心。

在發帖之前,Facebook 知道什么?

在點擊”post”之前,Facebook 可能就開始收集數據了。當你編輯信息時,Facebook 開始收集你的按鍵內容

Facebook 曾經使用這些數據來研究自我審查(研究報告 PDF)。

prepost.png

研究員寫道:

我們報告的結果來自一份探索性分析,檢查 Facebook 「最后時刻」的自我審查,或者在寫完后在 Facebook 被過濾的內容。我們在 17 天內收集了 390萬名用戶的數據,并將自我審查行為與用戶描述、用戶社交圖表以及他們之間的互動特徵聯系起來。

這意味着,如果你發布了類似於「我只是討厭我的老板,他把我逼瘋了。」這樣的內容。雖然在最后一刻刪除了這句話,改寫為「伙計,現在的工作真是太瘋狂了」,Facebook 仍然知道你在刪除之前輸入的內容。

以下是他們用於研究的數據點:

prethought.png

這里值得注意的是:就像不能確保未發布的內容不會被存儲;用戶刪除帖子、評論和簽到,不能確保數據真的被刪除了。

因此,即使刪除了帖子,Facebook 仍記錄了它。Facebook 記錄元數據,或記錄有關你的數據的數據。比如,撥打電話的數據就是實際談話內容,它的元數據是撥打電話的時間、地點和時長等信息。

對於 Facebook 來說,元數據和真實數據同等重要,它使用元數據推斷你的身份。在 Chrome 瀏覽器使用開發者工具,可以相對容易地看到大量數據通過 xhr 從你的客戶端傳送到 Facebook 后端。我不是一個前端忍者(但實際上我很樂意和其中一位談話,看看我們還能做些什么),但從一張圖上,可以看到 Facebook 在追蹤用戶做某件事花費的時間嗎?具體內容不確定,但它可能計算出了耗費在 Facebook 網站的時間。Facebook 報道說

xhr-fb.png

順便說一句,對於賬戶刪除也是如此。

由於 Facebook 擁有如此多的系統和可以數據共混的地方,正如一位 Facebook 前顧問所寫:

回答你提問的第一部分,「你可以付錢讓 Facebook 徹底刪除你的所有信息嗎?」假設「徹底」意味着完全清除你留在 Facebook 的任何痕跡。答案是不會。

同樣,如果刪除帖子,并不能確保 Facebook 不會在后台數據庫保存這個帖子,它只是不會顯示在客戶端頁面。

只要你真的寫了帖子、上傳了圖片,或是修改了任何信息,對於 Facebook 內部研究使用、轉售給 Acxiom 這樣的營銷聚合商、通過國家安全局這樣的機搆和 NSA 的稜鏡計划提供給美國政府,這一切都是絕對公平的游戲。

發帖之后:Facebook 收集關於你的什么數據

很顯然,Facebook 收集你自願提供給它們的所有數據:政治派別、工作地點、最喜歡的電影、最愛讀的書、打卡簽到的位置、評論、對帖子的任何所有反應。Facebook 允許你下載他們的數據庫中關於你的數據子集

在我個人的數據子集中,我可以看到:

  • 我上傳的照片、標記了我的照片
  • 視頻
  • 我曾經發布在自己時間線上的一切內容(包括我表示感興趣的事情、人們發布在我的時間軸上的內容、共享的記憶)
  • 好友、添加我為他們的好友
  • 我的所有私人信息
  • 我參加過的活動
  • 我登錄過的每一台設備

以及,我可能感興趣的廣告。這不是我自己寫的東西,而是 Facebook 基於我發布的每條內容,利用算法生成的。

我們將會在廣告部分討論這個問題。

除了數據和元數據,Facebook 也跟蹤用戶的意圖。上面已經探討了其中一種跟蹤方式:未發布的信息,另一種則是在視頻中的熱圖跟蹤

Facebook不僅知道關於你的一切信息,也了解你的朋友關系。一言以蔽之,Facebook 很了解你,盡管你沒有完整填寫你的個人資料、也沒有主動發布到網站。

Facebook 內部用你的數據做了什么?

Facebook 利用收集到的數據做了很多事情。

首先,Facebook 對信息進行簡單查詢用於提高網站性能或用於行業報告(例如,網站運行時間,Facebook 用戶數量,今天的廣告收入是多少?)。這對於任何公司都是如此。

不過,對於 Facebook 來說有所轉變。Facebook 有一個完整的工程團隊致力於搭建工具,使得數據更易於用 SQL——類似基於 Hadoop 和 Hive 的語言——查詢。盡管 Facebook 聲稱嚴格控制權限,有些用戶卻并不這么認為

唱片公司 Anjunabeats 主管 Paavo Siljamäki 在 Facebook 發帖提醒人們注意這個問題,訪問該公司洛杉磯辦事處時,可以很容易訪問他的 Facebook 賬戶而無需他的密碼。

這里是 Facebook 員工訪問私人數據的賬戶的更多說明

其次,Facebook 把用戶作為實驗對象進行學朮研究。在數據政策中沒有提到這一點,這很有意思, Facebook Research 主頁的標題寫着:「在 Facebook, 研究滲透到我們所做的一切。」

Facebook 有一個相當大的數據科學團隊(最新統計是 41 人)。我想說的是,一個擁有 15000 人同樣規模的公司,如果它真的想要積極推動一個數據科學研究項目,可能只有 5 個數據科學家。

然而,直到 2014 年為止,還沒有任何程序可以檢查被訪問的數據類型、以及進行怎樣的研究。正如一位前 Facebook 數據科學家寫到

我在 Facebook 的時候,沒有一個機搆審查委員會來審查為內部目的進行實驗的決定。一旦有人得出結論,他們決定要把這篇文章發表到雜志上,那么在可發表的內容上,確實存在反反復復的公共關系和法律問題。如果你想做一個實驗,看看人們會點擊綠色按鈕還是藍色按鈕,你無需得到批准。同樣,如果要測試新的廣告定位系統,以查看用戶是否點擊了更多廣告,是否收入增加,無需獲得機搆批准。

雖然他接着指出這在大多數以軟件服務的公司中是正常的,但大多數 SaaS 公司在過去十多年中也沒有精心收集人們生活中最私密的細節。

他繼續說道:

大多數人在 Facebook 研究數據的基本目的是影響和改變人們的情緒和行為。他們一直在做這件事,讓你更喜歡故事,點擊更多的廣告,花費更多時間在 Facebook 網站。

盡管這是大多數網站的目標,但每天花費超過 40 分鐘 在企圖在情感上削弱你的網站上,你可能需要三思而后行。

Facebook 除了挖掘文本內容、研究我們的情緒,它還會操縱它們

新聞 Feed 是操作的首選。特別是因為 Facebook 已經設計出盡可能吸引人的功能:它是我們神經系統的突觸糖。Facebook 希望確保你盡可能在 Feed 多花時間,并為此花更多時間來處理嬰兒照片和其它快樂的事情,以及那些引發爭議和憤怒的新聞。而像「我今天吃過早餐」這樣的正常狀態不會引起任何反應。

這就是當今所謂過濾氣泡是怎樣興起的。因為人們會點一些他們感興趣的東西,所以 Facebook 就只呈現吸引用戶的內容,這意味着其他觀點、朋友和圖片會從一個人的 Facebook Feed 中刪除。如果想了解這種方式是如何工作的,可以參考 Red Feed、Blue Feed, 展示了自由與保守的 Facebook Feed 的不同之處。

他們還在研究其它什么?首先是同性戀出櫃比例。Facebook 如何知道這些的?「在過去的一年里,大約有 80 萬美國人更新他們的個人資料,表達同性吸引或專屬性別」。

大量的 Facebook 研究都是關於圖論,也就是我們和朋友間的關系圖。換句話說,它正在對從未同意的學科進行人類學研究。

例如在近期,數據科學小組發表了一項關於美國移民社區的社會關系的研究。在報告中,研究員使用了以下數據:

我們將我們的分析限制在基於已經被確認的社交網絡數據基礎上的綜合判斷,這些人在分析前 30 天內至少使用過一次 Facebook. 我們使用個人資料中指定的家鄉來確定用戶的國籍。

此外,我們也把分析限制在目前至少有2個朋友居住在本國的人和目前居中在美國的另外 2 個朋友。我們的結果基於超過 1000 萬滿足這些標准的人的樣本。整篇報告中,所有關於 Facebook 用戶的引用都毋庸置疑地暗示了這些限制。

這些是我們知道的公開研究,他們還在做哪些非公開的研究?

Facebook 理所當然喜歡研究的另一個內容是人臉。每次你在照片中標記自己時,Facebook 會認出你,并且做相應調整。

Facebook 鼓勵用戶在他們個人帖子中上傳的照片中「標記」人,社交網絡將收集到的信息儲存起來。Facebook 使用一個叫作 DeepFace 的程序來匹配用戶的其它照片。

selfie.png

這個名為 DeepFace 的程序是獲取更多准確標簽的絕佳方式。它也是侵犯個人隱私的絕佳手段。比如,倘若你不想被標記該怎么辦?假如你在政府抗議活動中?或者簡單來說,如果你和一位朋友去聽音樂會,不是和另一位朋友,卻還不想讓對方知道,該怎么辦?

不幸的是,很快就沒有隱私可言了。Facebook 正致力於識別照片中人的身份。Facebook 上關於 DeepFace 的論文指出,「人臉識別技朮對社會和文化影響是深遠的」,然而根本沒有談到人臉被標記的可能的隱私危險。比如

她說,『我們很快就會在商店里安裝攝像頭,以識別顧客的購物情況』。

他們怎么知道這些的?

因為這些數據是我們自願提供的。每次更新狀態、上傳照片并做標記、給朋友發信息、在一個地方簽到、登錄 Facebook, 系統都會自動生成一條信息保存到數據庫中——「嘿,這個人現在在Facebook 世界里。」,包括了 WhatsappInstagram 兩個應用。

影子檔案

如果你不願意分享那么多數據,Facebook 會怎么做?它創建了影子檔案或是「Facebook 收集的有關你沒有提供的數據集」。

正如這篇文章所述:

盡管你從未提供它們,但 Facebook 很有可能獲取了你的備用郵箱地址、電話號碼、家庭地址。所有這些都是由嘗試尋找并聯系你的朋友提供的。

更糟糕的是,Facebook 主要收集你的面部信息。

最近的一起訴訟不是針對郵箱地址和電話號碼,而是「人臉模板」:每當用戶上傳照片時,Facebook 會掃描所有人臉并創建「數字生物識別模板」。

即使 Facebook 只是為自己收集數據,所有這一切也是有關系的。但還有一些外部供應商。

Facebook 和營銷人員是什么關系?

Facebook 的數據政策指出,它和其它供應商合作收集關於你的數據:

我們會從第三方合作伙伴收到有關你和你的 Facebook 在線與離線的活動信息。例如,當我們聯合提供服務時,來自合作伙伴的信息,或從廣告商那里獲得關於你的經曆、與他們互動的信息。

Facebook 收集了「大約 29,000 個人口統計指標,其中 98% 基於用戶在 Facebook 的活動」。

與此同時,據報道大約有 600 個數據點來自 Experian,Acxiom等獨立數據代理商,用戶無法訪問從第三方獲得的人口統計數據。

除了收集你自願提供的所有詳細信息,比如姓名全稱、出生日期、興趣愛好、宗教信仰、以及所有你上過學和工作過的地方,Facebook 還會對它不知道的事情作出假設,這樣就可以與 Acxiom 、其它廣告代理商分享數據,以便更有效地把你作為目標。

比如,Facebook 使用家庭收入創建數據檔案賣給營銷商,他們畢竟是 Facebook 的付費客戶。然后,營銷人員可以購買細分資料,包括以下任何一種

地理位置、年齡、世代、性別、語言、教育水平、研究領域、學校、族裔關系、收入和淨資產、房屋所有權和類型、房屋價值、財產大小、房屋面積、建造年份、家庭組成。

Facebook 如何知道這些的?根據它所知道的和從 Experian 等處獲取的數據,對你作出一些假設

這類數據隨后可以用來以廣告的形式定位 Facebook 用戶。在 Facebook 做的這種定位告訴你很多關於他們隱藏在幕后的數據。例如,不僅可以通過位置/年齡/性別/語言,還能通過興趣愛好和不同生活階段(如剛剛訂婚、6個月前訂婚、早期學齡兒童)定位目標。如此過細地定位一個人是有可能的,而且還能達到一定數量(在我的例子中是 100-200 人)。

targeted.png

這些數據會被轉賣到下游,通過信用卡和其它營銷資源,與其它既存的關於你的數據混合在一起,從而創建類似這樣的網站,試圖建立你的完整個人資料。沒有簡單的方式來擺脫它,因為一旦創建了數據,刪除它難上加難了。這就是為什么隱私活動人士最關心的問題之一是讓公司每隔一段時間刪除大量數據。

Facebook 也有權在廣告里使用你和未滿18歲孩子的照片

Facebook 給政府提供什么數據?

我們并不了解 Facebook 提供給政府的所有信息。Facebook 有一個政府報告頁面,該頁面自 2016 年6月以來沒有更新過。但我們知道政府還在要求獲取越來越多的信息

這些數據成為一份報告,報告顯示了數據訪問量和受影響的用戶量,但沒有提到任何關於所提供信息的類型、訪問數據的機搆類型(當地政府、州、聯邦調查局/國家安全局)。

國家 用戶數據要求總量 參考的用戶賬戶總數 產生某些數據請求的百分比 內容限制 保存要求 保留的用戶/帳號
美國 23,854 38,951 80.65% 0 31893 56714

馬克·扎克伯格(Mark Zuckerberg)甚至發表聲明

Facebook 過去不是,現在也從來沒有參與任何讓美國或任何其它政府直接訪問我們服務器的計划。我們從來沒有收到任何政府機搆的一般要求或法院命令,提供大量信息或元數據的,據說 Verizon 收到過這樣的要求。如果我們這樣做了,會積極與之抗爭。在昨天之前,我們甚至沒聽說過稜鏡計划。

在這里,重要的是從字里行間讀出的含義。直接訪問服務器不是發送大容量文件的必要條件,也沒有必要以此名了解稜鏡計划

也很難知道國家安全局是否以其它方式從 Facebook 收集數據。至少在歐洲,有關此問題的訴訟正在進行中

但就目前而言,僅僅假設這種監控正在進行

退出 Facebook 后,Facebook 會跟蹤什么?

在 Facebook 網站之外,Facebook 通過單點登錄跟蹤用戶。

如果你退出,Facebook 也會通過 cookies 跟蹤你。正如它們的隱私政策所述

當你訪問或使用第三方網站和應用了我們服務的程序時,我們會收集信息。收集的信息包括訪問的網站和應用程序、在這些網站和應用上使用我們的服務、以及網站或應用的開發者或發布者提供給你或我們的信息。

Facebook 也在試圖跟蹤或已經在跟蹤你的光標在屏幕上的移動情況

早在 2011 年,如果你仍然登錄着 Facebook, 它就開始跟蹤你如何在網絡上移動

未經你同意,Facebook 會記錄你登錄后所在網頁的位置。Nik Cubrilovic 深入挖掘了一下,發現即使登出 Facebook 仍會跟蹤你的位置。Facebook 否定了這一說法。

可以肯定的是,Facebook 收集你的瀏覽曆史來丰富廣告。

當我使用 Facebook 時應該考慮什么?

這一切意味着什么?從本質上講,它意味着你在 Facebook 上做的每件事情,或是通過其它網站登錄,都可能會被 Facebook 偷偷地跟蹤并保留在服務器上。

需要明確的是,很多公司目前都會對用戶進行某種形式的跟蹤。除此以外,沒有其它方式可以衡量經營活動。但是 Facebook 顯然在一段時間內躡手躡腳地走出了道德上可接受的數據業務實踐的范圍。盡管 Facebook 目前沒有做我提及的一些事情(抓取預發布內容、擾亂新聞訂閱源),但它們也在做着非常相似的工作,而且沒有隱私保障和,也不保證不用於實驗。這也意味着即使你在 Facebook 并不活躍,仍會被跟蹤。

每個像你這樣的人發的帖子、添加的每個好友、簽到的每個地方、點擊的每個產品類別、每張照片,都會保存在 Facebook 并被聚合在一起。

如何聚合?很難描述。可能是社會實驗的一部分,也許你的信息正被提交給政府部門;也許Facebook 的那些沒有必要擁有此權限的員工可以訪問你的頁面、查看你的工作經曆;也許相同的就業信息正被發送給保險公司。

這包括了所有的私人小組、封閉小組以及所有的消息。正如 Facebook 指出的,在 Facebook 不存在隱私這回事。

實質上,你需要加入 Facebook, 這意味着接受你做的每件事情都會被公開,或是被用於廣告、政府機搆分析。

如果不想讓 Facebook 獲取我的數據,應該怎么辦?

Facebook 開始是大學生互相聯系的一種方式,最終達到了改變人們行為、跟蹤用戶使用情況,并且可能為政府整合信息的程度。

問題在於無論誰是否使用 Facebook, 都牽涉到 Facebook 的跟蹤、關系標簽、影子檔案系統。如果你是 Facebook 活躍用戶,尤其如此。

因此,最重要的事情是意識到這種情況正在發生,并盡可能少給 Facebook 提供數據。

下列是我為了盡量減少在 Facebook 的曝光而做的事情。

并非每個人都會像我這樣做。但最重要的是,即使你決定繼續使用 Facebook , 也要知道Facebook 在使用你的數據做什么,并且有權在社交中作出權衡。

  1. 不要發布過多的個人信息。
  2. 不要發布你孩子的任何照片,特別是當他們處在無法同意的年齡。
  3. 當你用瀏覽器訪問 Facebook 后, 退出 Facebook. 使用一個單獨的瀏覽器訪問 Facebook, 其它事情則用另一個單獨的瀏覽器。
  4. 使用廣告攔截插件。
  5. 組織或參與政治活動,不要使用 Facebook , 尤其是 Messenger 應用。如果你需要組織活動,用 Facebook 作為發起端,然后換用別的平台。推荐平台:Signal 是目前私密聊天的典范。Whatsapp 的群組聊天是可以的,但我不推荐它,因為它與 Facebook 的元數據系統緊密相聯。電報(Telegram)也不錯,但還不夠好,因為它不是開源應用。此外,它取決於你的風險等級。這是有關這些平台更多信息。
  6. 不要在手機上安裝 Facebook 應用程序,它會請求許多不合理的權限
  7. 不要在手機上安裝 Messenger 應用。使用移動端網站。目前,Messenger 應用在移動設備上被屏蔽,可以在瀏覽器啟用桌面版

很遺憾,做得如此好的社交網絡在互聯網上也是最糟糕的。但是,在人們遠離這個平台或對它施加某種經濟壓力之前,任何都不會改變。

就我個人而言,作為一個數據專家,我個人所做的事情就是給發郵件給我的 Facebook 招聘人員發送以下信息:

親愛的招聘專員:

Facebook 收集、使用數據的方式,包括:

這讓我不僅強烈反對在 Facebook 工作,而且使我有力地評估了自己使用 Facebook. 因為我從來不知道輸入這個系統的每個字符將如何被使用。

如果 Facebook 公司承諾要改變發展方向,并且

  • 利用數據來解決這些問題
  • 積極研究如何刪除不必要的數據
  • 積極研究非政府干預的私人安全通訊
  • 并積極研究如何避免私人客戶數據被共享給不必要的第三方

我很想知道。

謹啟

Vicki

我們是社會性動物,我們想要連接、得到認可、分享、在其他人所在的平台上組織活動。目前而言,這是 Facebook 的優勢。此外,很難說 Facebook 完全是壞的:它的確把人們聯系起來,幫助組織聚會和活動,并且確實使世界更加互聯互通。

但是,作為 Facebook 用戶,我們和我們的數據是它的產品。而且,隨着我們對這些數據的使用方式了解更多,我們仍然可以按照它的規則使用 Facebook,但要對它有所了解。

這里是黑客新聞討論區。

E-learning 3.0 核心概念之「数据」

第一节课介绍了 web 1.0, web 2.0, web 3.0 的特点,也是不同阶段互联网技术发展的主流应用。

这是 E-Learning 3.0 MOOC 第二节课程。从本节开始将依次讲解 Web 3.0 同时也是 E-Learning 3.0 涉及的 9 个核心概念。

本节课程页面在这里,Stehen Downes 和 Shelly Blake-Plock(Yet Analytics 创始人)对谈:https://www.youtube.com/watch?v=dsmdwnUwKkA


这节课的信息量非常大,第一次听说 SCROM、xAPI、LMS、LRS 这些概念,需要从对数据演变过程和去中心化入手。

在线内容:从文件到数据

正如 Stephen Downes 在数据这节课的文章 https://el30.mooc.ca/cgi-bin/page.cgi?post=68416 里所说,web 1.0 时代基于客户端-服务器模式,以文件和网页为主,在线学习的内容呈现形式也是如此,它们之间没有很好的交互、呈现标准也会不统一,而且 DVD 这类资源存放在用户端,没办法不同多终端使用。web 2.0 出现了基于数据和平台互操作性的网络。web 3.0 时代则将平台作用削弱,直接是终端之间直接交互,也就是分布式网络,也就是 e-learning 3.0.

在这个过程中,我们对内容的理解从普遍的(现在依旧还在用的)word/pdf/excel/video 等形式文档,随着对内容交互、分布式、共享互相链接的增加,转变扩展到对关于内容、使用者(学习者)的更多元数据的获取和分析。

When we created a learning resource, we created data about that resource, and this contained fields like ‘title’ and ‘typical age range’. From there it is a very small step to putting our content into the database as well, and completely converting our document into data. Most web-based content today comes from some sort of database.

例如,创建一份在线数据表单来收集统计一些必要的信息。在这份表单制作中设置的字段和填表对象填写的信息都是数据。现在很多在线表单平台都会提供简单的数据统计分类。

再比如,Facebook、Google 都会收集有关用户的一切信息,作为分析的 metadata, 在文章「使用 Facebook 时,应该考虑什么?」中,作者 Vicki Boykis 说明了 Facebook 获取用户数据之多,以及如何利用这些数据获利。

The dependence on centralized sources for linked data has led to the rise of platforms like Facebook and Twitter, with the result that people no longer feel in control of their own data, and even worse, have difficulty accessing and sharing this data. Also, it has become increasingly difficult to read this data without being tracked and without being forced to view advertisements and unwelcome messages.

数据:从中心化到 去中心化

关键词:去中心化linked data

如 Yet Analytics 创始人 Shelly Blake-Plock 所说「data goverance can be used for good or evil」(https://www.lauraritchie.com/2018/10/25/el30-notes-week-1/)。我们也可以看到、已经深刻体会到网络上个人隐私安全问题,即使在单纯的在线学习过程中,也需要考虑这一点。去中心化则是一种新的选择。

除了这一点,更重要的是因为众多数据资源需要直接被获取、便捷共享、互相链接、在不同终端随时随地使用,每个人都可以管理控制自己的数据。

在 web 2.0 时代,我们把来自不同来源的数据堆积放在同一个网页上,这些都是在网页平台的幕后操作的。浏览器仍然需要从单一的网页上收到内容来呈现和组合。如果我们可以直接获取源数据库,根据自己的需要来选择、组合数据。

From the perspective of the browser, everything is pretty much the same. It doesn’t matter whether a web page was created from one data source or a dozen. The browser still had to visit a web page and still received content from that single source to assemble and display to the viewer.

web 3.0 是一个去中心化链接数据的时代。每个人都可以管理自己的数据,随时随地存储并使用。像 SolidIndieWeb 项目就正在寻找方法,使用户可以创建和管理自己的数据。

学习者个人如何管理数据

Stephen Downes 与 Shelly Blake-Plock 对谈中谈到的用于记录、存储、分析学习进度的技术 SCORM、xAPI、LRS 等等,暂时还不想深入了解这些。昨天翻了中文圈的「教育大数据国际联盟」网站,里面有一些关于 xAPI 的介绍。目前对我来说有些深奥,还用不到它们。

Learning also becomes a process of being able to comprehend data, to be able to look at representations of data though dashboards and visualizations, and to be able to identify patterns and draw conclusions. It’s interactive, immersive and engaging, a process of learning how to perceive and comprehend rather than to decode and store.

学习也成为能够理解数据、通过仪表盘和可视化来观察数据表现,并能识别模式、得出结论。它是一个互动式、沉浸式、吸引人的过程,是一个学习如何感知(perceive)、理解(comprehend)的过程,而不是简单的解码和存储。

作为一个自主学习者,在不想将这些数据交由互联网公司获取管理的情况下,个人如何管理自己的学习资源和进度?很高兴看到「eLearning 3.0: How do I show my expertise?」 这篇思考文章。作者提出了很多问题,认为一个人记录更新自己的学习过程,取决于具体的情况(it depends)。

学习 E-Learning 3.0 MOOC

-1. 关联主义与学习

关联主义(Connectivism) 基于这样一种观点,即知识的本质是网络中联结的集合。因此,学习就是创造和塑造这些网络的过程。

关联主义课程的重点是发展两种类型的知识:个人知识(personal knowledge)、由活动和经验形成的想法和信念网络;另一种是社会知识,通过交流和互动形成的人与制度的公共网络。

MOOC 环境是为了支持这两种类型的学习。MOOC 没有一节单一的课堂或学习管理系统;相反,该课程本身是为个人网站或博客之间创建关联,并通过这个网络创建不间断的交流与合作。理想情况下,课程参与者会有管理个人知识网络的工具和方式,通过社交网络进行互动。

课程内容包括由参与者创建和分享的数字媒体。导师的角色是为课程提供网络资源、参考资料和背景阅读、介绍一些核心课程内容、任务和活动,以及与讲师或者课程参与者讨论的音频或视频。

除此之外,为了创建一个反映整个社区情况的课程,期待参与者增加他们自己的贡献,并公开彼此分享,通过这种作法建立自己的知识和学习社区。

课程的目的并不是要让参与者学习或者记住一些内容。每个人都带着自己的学习目标进入课程。

在一个大规模的在线公开课中,内容比任何个人都多,更不用说记忆了。因此,每个人在课程中的体验是独一无二的,参与者的互动受每个人对这些材料的个人视角所驱动。

关联主义课程的学习是新兴的,它不是被定义、转移或者传递的,而是通过个人经验和互动过程创造的。对于课程中的每个人来说,这门课是新的、与众不同的;在更广泛、更社会化的意义上,它也是整个课程的结果。

0. E-learning 1 and 2

我们正在进入万维网的第三个阶段,它将重新定义在线学习(online learning)。

第一阶段的互联网(web 1.0)最初发展于 1994 年,基于客户端-服务器模式,侧重于网页和文件处理。

第二阶段 web 2.0 时代,创建了一个基于数据和平台互操作性的网络。

互联网第三阶段 web 3.0,平台所发挥的中心作用被削弱,倾向于同行之间的直接交互,也就是分布式网络。

第一代网络由内容管理服务(content management services, CMS)主导,从简单的网页服务器到数据库驱动。学习管理服务(learning management services, LMS)是一个具有教育意图的 CMS. 第二代互联网服务的兴起使得人们可以互相交换内容和媒体。

这个课程将介绍第三代互联网 web3.0, 以及对在线学习的影响。在 web3.0, 我们看到云技术、分布式网络技术的广泛应用,以及开放数据和个人加密技术。

web3.0 的内容看起来很像 web1.0 和 web2.0,仍然会有文件、网页、视频。但是这些媒介将通过分布式内容网络进行获取,通过散列算法(hash algorithms)和数字密钥(digital keys)加密,并且可以动态地实时更新内容。我们将访问分布式应用程序,从而使我们可以获得数据流。这些数据流可能是数字货币、在线体育广播、政府统计资料或者学习应用程序。

在 web3.0 时代,通过这些分布式资源学习,这会是一个导航、混合、重组资源、并将他们应用于真实的挑战和现实世界问题的过程。一方面,e-learning 3.0 将以个人自身利益为出发点培养个人技能;另一方面,与同事和同行合作开展工作和学习,在就业和业绩支持网络内培养能力。

大规模网络公开课(MOOC)介于 web2.0 和 web3.0 之间。它期望在资源和个人课程开发和管理方面建立去中心化的网络,但它依赖于社交网络和在线学习平台等 web2.0 工具。

因此,虽然在线学习3.0(e-learning 3.0)在很多方面预计使用连接主义的学习形式,但工具、过程、结果都是新的。这门课程成为一组链接数据源,其中的链接不仅由教育机构定义,而且由参与者和学习者定义,并且来源从多样的环境中提取和传递到多重环境中。

在这节课的演讲视频「E-Learning3.0——下一波新兴学习技术的影响」里,Stephen Downes 概括性的介绍了 E-Learing3.0 的 9 个核心概念:

  1. Data
  2. Cloud
  3. Graph
  4. Community
  5. Identity
  6. Resources
  7. Recognition
  8. Experience
  9. Agency

Q1:分布式(distributed)和去中心化(decentralized)之间的关系是什么?

根据文章 What is the difference between decentralized and distributed systems? ,去中心化系统是分布式系统的子集。两者主要的区别在于 如何/在何处做「决策」,以及信息如何在系统里通过控制节点共享。
1_nnpzTe1hx74WKICL3Gj34A.jpeg

Decentralized means that there is no single point where the decision is made. Every node makes a decision for it’s own behaviour and the resulting system behaviour is the aggregate response.

去中心化意味着没有单一节点做决策。每个节点决定自己的行为,结果系统行为是聚合响应。

Distributed means that the processing is shared across multiple nodes, but the decisions may still be centralized and use complete system knowledge.

分布式意味着在多点之间共享,但是决策可能仍然中心化,并使用完整系统知识。

使用 Facebook 时,应该考虑什么?

原文:https://veekaybee.github.io/2017/02/01/facebook-is-collecting-this/

winnower.jpg

Courbet, The Winnowers

摘要:Facebook 通过众多渠道使用数百种方法收集有关你的数据。你很难退出,但通过了解他们收集的内容,可以认识到 Facebook 平台的危险性,并选择以更严格的限制来使用 Facebook.

目录:

Facebook 无论好坏,已经成为我们的网络客厅、第三空间。这是我们与好友交谈、发布新闻、组织活动、悼念逝者、庆祝婴儿出生、订婚、找新工作、展示新发型和假期的地方。

Facebook 平台已经占据了如此大的占有率,并且开始作为我们的冥想盆。因此,了解 Facebook 公司获取使用我们的希望、梦想、政治宣言、婴儿照片信息做什么尤为重要。

从获取数据开始。2014年,Facebook 工程师写到他们每天可以获取大约 600TB 的数据

对比一下,《战争与和平》的文本大小是3.1MB;1966年的苏联版《战争与和平》电影时长7小时,大小是8GB

因此,人们每天上传的数据总量相当于1.93亿本《战争与和平》书籍、75,000部《战争与和平》电影。

Facebook 数据政策 概述了它收集的内容和如何处理数据。然而,和大多数公司一样,Facebook 忽视了实际要点,没有告诉用户到底发生会什么。

我揣测自己写每条状态更新时的按键,使我感到沮丧,对此决定做一些研究。以下所有信息来自科技商业新闻报导、学术出版物、我作为 Facebook 用户能够在客户端看到的内容。作为一名从事用户数据工作10年以上的专家,我在这篇文章中加入了自己的诠释。

如果任何一位 Facebook 员工想要对此篇文章进行纠正,我会很乐意听他们说并没有像下文所说的那样收集和处理用户数据。

Facebook 如何收集数据

为了理解 Facebook 数据收集的工作原理,我绘制了一个(非常非常)简单的图表。用户将数据输入用户界面(应用程序),这是前端。

这些数据随后被收集到 Facebook 的数据库(这些数据库有很多),这是后台。

用户在前端看到的数据是后台数据的子集。

facebookui.png

如果你对更多的技术规格感兴趣,Google 上面有很多架构图。Facebook 正处在处理大数据的前沿,它们的堆栈包括 Hive, Hadoop, HBase, BigPipe, MySQL, Memcached, Thrift 更多。所有这些都存放在许多大型数据中心,比如 Prineville Oregon 数据中心。

在发帖之前,Facebook 知道什么?

在点击”post”之前,Facebook 可能就开始收集数据了。当你编辑信息时,Facebook 开始收集你的按键内容

Facebook 曾经使用这些数据来研究自我审查(研究报告 PDF)。

prepost.png

研究员写道:

我们报告的结果来自一份探索性分析,检查 Facebook 「最后时刻」的自我审查,或者在写完后在 Facebook 被过滤的内容。我们在 17 天内收集了 390万名用户的数据,并将自我审查行为与用户描述、用户社交图表以及他们之间的互动特征联系起来。

这意味着,如果你发布了类似于「我只是讨厌我的老板,他把我逼疯了。」这样的内容。虽然在最后一刻删除了这句话,改写为「伙计,现在的工作真是太疯狂了」,Facebook 仍然知道你在删除之前输入的内容。

以下是他们用于研究的数据点:

prethought.png

这里值得注意的是:就像不能确保未发布的内容不会被存储;用户删除帖子、评论和签到,不能确保数据真的被删除了。

因此,即使删除了帖子,Facebook 仍记录了它。Facebook 记录元数据,或记录有关你的数据的数据。比如,拨打电话的数据就是实际谈话内容,它的元数据是拨打电话的时间、地点和时长等信息。

对于 Facebook 来说,元数据和真实数据同等重要,它使用元数据推断你的身份。在 Chrome 浏览器使用开发者工具,可以相对容易地看到大量数据通过 xhr 从你的客户端传送到 Facebook 后端。我不是一个前端忍者(但实际上我很乐意和其中一位谈话,看看我们还能做些什么),但从一张图上,可以看到 Facebook 在追踪用户做某件事花费的时间吗?具体内容不确定,但它可能计算出了耗费在 Facebook 网站的时间。Facebook 报道说

xhr-fb.png

顺便说一句,对于账户删除也是如此。

由于 Facebook 拥有如此多的系统和可以数据共混的地方,正如一位 Facebook 前顾问所写:

回答你提问的第一部分,「你可以付钱让 Facebook 彻底删除你的所有信息吗?」假设「彻底」意味着完全清除你留在 Facebook 的任何痕迹。答案是不会。

同样,如果删除帖子,并不能确保 Facebook 不会在后台数据库保存这个帖子,它只是不会显示在客户端页面。

只要你真的写了帖子、上传了图片,或是修改了任何信息,对于 Facebook 内部研究使用、转售给 Acxiom 这样的营销聚合商、通过国家安全局这样的机构和 NSA 的棱镜计划提供给美国政府,这一切都是绝对公平的游戏。

发帖之后:Facebook 收集关于你的什么数据

很显然,Facebook 收集你自愿提供给它们的所有数据:政治派别、工作地点、最喜欢的电影、最爱读的书、打卡签到的位置、评论、对帖子的任何所有反应。Facebook 允许你下载他们的数据库中关于你的数据子集

在我个人的数据子集中,我可以看到:

  • 我上传的照片、标记了我的照片
  • 视频
  • 我曾经发布在自己时间线上的一切内容(包括我表示感兴趣的事情、人们发布在我的时间轴上的内容、共享的记忆)
  • 好友、添加我为他们的好友
  • 我的所有私人信息
  • 我参加过的活动
  • 我登录过的每一台设备

以及,我可能感兴趣的广告。这不是我自己写的东西,而是 Facebook 基于我发布的每条内容,利用算法生成的。

我们将会在广告部分讨论这个问题。

除了数据和元数据,Facebook 也跟踪用户的意图。上面已经探讨了其中一种跟踪方式:未发布的信息,另一种则是在视频中的热图跟踪

Facebook不仅知道关于你的一切信息,也了解你的朋友关系。一言以蔽之,Facebook 很了解你,尽管你没有完整填写你的个人资料、也没有主动发布到网站。

Facebook 内部用你的数据做了什么?

Facebook 利用收集到的数据做了很多事情。

首先,Facebook 对信息进行简单查询用于提高网站性能或用于行业报告(例如,网站运行时间,Facebook 用户数量,今天的广告收入是多少?)。这对于任何公司都是如此。

不过,对于 Facebook 来说有所转变。Facebook 有一个完整的工程团队致力于搭建工具,使得数据更易于用 SQL——类似基于 Hadoop 和 Hive 的语言——查询。尽管 Facebook 声称严格控制权限,有些用户却并不这么认为

唱片公司 Anjunabeats 主管 Paavo Siljamäki 在 Facebook 发帖提醒人们注意这个问题,访问该公司洛杉矶办事处时,可以很容易访问他的 Facebook 账户而无需他的密码。

这里是 Facebook 员工访问私人数据的账户的更多说明

其次,Facebook 把用户作为实验对象进行学术研究。在数据政策中没有提到这一点,这很有意思, Facebook Research 主页的标题写着:「在 Facebook, 研究渗透到我们所做的一切。」

Facebook 有一个相当大的数据科学团队(最新统计是 41 人)。我想说的是,一个拥有 15000 人同样规模的公司,如果它真的想要积极推动一个数据科学研究项目,可能只有 5 个数据科学家。

然而,直到 2014 年为止,还没有任何程序可以检查被访问的数据类型、以及进行怎样的研究。正如一位前 Facebook 数据科学家写到

我在 Facebook 的时候,没有一个机构审查委员会来审查为内部目的进行实验的决定。一旦有人得出结论,他们决定要把这篇文章发表到杂志上,那么在可发表的内容上,确实存在反反复复的公共关系和法律问题。如果你想做一个实验,看看人们会点击绿色按钮还是蓝色按钮,你无需得到批准。同样,如果要测试新的广告定位系统,以查看用户是否点击了更多广告,是否收入增加,无需获得机构批准。

虽然他接着指出这在大多数以软件服务的公司中是正常的,但大多数 SaaS 公司在过去十多年中也没有精心收集人们生活中最私密的细节。

他继续说道:

大多数人在 Facebook 研究数据的基本目的是影响和改变人们的情绪和行为。他们一直在做这件事,让你更喜欢故事,点击更多的广告,花费更多时间在 Facebook 网站。

尽管这是大多数网站的目标,但每天花费超过 40 分钟 在企图在情感上削弱你的网站上,你可能需要三思而后行。

Facebook 除了挖掘文本内容、研究我们的情绪,它还会操纵它们

新闻 Feed 是操作的首选。特别是因为 Facebook 已经设计出尽可能吸引人的功能:它是我们神经系统的突触糖。Facebook 希望确保你尽可能在 Feed 多花时间,并为此花更多时间来处理婴儿照片和其它快乐的事情,以及那些引发争议和愤怒的新闻。而像「我今天吃过早餐」这样的正常状态不会引起任何反应。

这就是当今所谓过滤气泡是怎样兴起的。因为人们会点一些他们感兴趣的东西,所以 Facebook 就只呈现吸引用户的内容,这意味着其他观点、朋友和图片会从一个人的 Facebook Feed 中删除。如果想了解这种方式是如何工作的,可以参考 Red Feed、Blue Feed, 展示了自由与保守的 Facebook Feed 的不同之处。

他们还在研究其它什么?首先是同性恋出柜比例。Facebook 如何知道这些的?「在过去的一年里,大约有 80 万美国人更新他们的个人资料,表达同性吸引或专属性别」。

大量的 Facebook 研究都是关于图论,也就是我们和朋友间的关系图。换句话说,它正在对从未同意的学科进行人类学研究。

例如在近期,数据科学小组发表了一项关于美国移民社区的社会关系的研究。在报告中,研究员使用了以下数据:

我们将我们的分析限制在基于已经被确认的社交网络数据基础上的综合判断,这些人在分析前 30 天内至少使用过一次 Facebook. 我们使用个人资料中指定的家乡来确定用户的国籍。

此外,我们也把分析限制在目前至少有2个朋友居住在本国的人和目前居中在美国的另外 2 个朋友。我们的结果基于超过 1000 万满足这些标准的人的样本。整篇报告中,所有关于 Facebook 用户的引用都毋庸置疑地暗示了这些限制。

这些是我们知道的公开研究,他们还在做哪些非公开的研究?

Facebook 理所当然喜欢研究的另一个内容是人脸。每次你在照片中标记自己时,Facebook 会认出你,并且做相应调整。

Facebook 鼓励用户在他们个人帖子中上传的照片中「标记」人,社交网络将收集到的信息储存起来。Facebook 使用一个叫作 DeepFace 的程序来匹配用户的其它照片。

selfie.png

这个名为 DeepFace 的程序是获取更多准确标签的绝佳方式。它也是侵犯个人隐私的绝佳手段。比如,倘若你不想被标记该怎么办?假如你在政府抗议活动中?或者简单来说,如果你和一位朋友去听音乐会,不是和另一位朋友,却还不想让对方知道,该怎么办?

不幸的是,很快就没有隐私可言了。Facebook 正致力于识别照片中人的身份。Facebook 上关于 DeepFace 的论文指出,「人脸识别技术对社会和文化影响是深远的」,然而根本没有谈到人脸被标记的可能的隐私危险。比如

她说,『我们很快就会在商店里安装摄像头,以识别顾客的购物情况』。

他们怎么知道这些的?

因为这些数据是我们自愿提供的。每次更新状态、上传照片并做标记、给朋友发信息、在一个地方签到、登录 Facebook, 系统都会自动生成一条信息保存到数据库中——「嘿,这个人现在在Facebook 世界里。」,包括了 WhatsappInstagram 两个应用。

影子档案

如果你不愿意分享那么多数据,Facebook 会怎么做?它创建了影子档案或是「Facebook 收集的有关你没有提供的数据集」。

正如这篇文章所述:

尽管你从未提供它们,但 Facebook 很有可能获取了你的备用邮箱地址、电话号码、家庭地址。所有这些都是由尝试寻找并联系你的朋友提供的。

更糟糕的是,Facebook 主要收集你的面部信息。

最近的一起诉讼不是针对邮箱地址和电话号码,而是「人脸模板」:每当用户上传照片时,Facebook 会扫描所有人脸并创建「数字生物识别模板」。

即使 Facebook 只是为自己收集数据,所有这一切也是有关系的。但还有一些外部供应商。

Facebook 和营销人员是什么关系?

Facebook 的数据政策指出,它和其它供应商合作收集关于你的数据:

我们会从第三方合作伙伴收到有关你和你的 Facebook 在线与离线的活动信息。例如,当我们联合提供服务时,来自合作伙伴的信息,或从广告商那里获得关于你的经历、与他们互动的信息。

Facebook 收集了「大约 29,000 个人口统计指标,其中 98% 基于用户在 Facebook 的活动」。

与此同时,据报道大约有 600 个数据点来自 Experian,Acxiom等独立数据代理商,用户无法访问从第三方获得的人口统计数据。

除了收集你自愿提供的所有详细信息,比如姓名全称、出生日期、兴趣爱好、宗教信仰、以及所有你上过学和工作过的地方,Facebook 还会对它不知道的事情作出假设,这样就可以与 Acxiom 、其它广告代理商分享数据,以便更有效地把你作为目标。

比如,Facebook 使用家庭收入创建数据档案卖给营销商,他们毕竟是 Facebook 的付费客户。然后,营销人员可以购买细分资料,包括以下任何一种

地理位置、年龄、世代、性别、语言、教育水平、研究领域、学校、族裔关系、收入和净资产、房屋所有权和类型、房屋价值、财产大小、房屋面积、建造年份、家庭组成。

Facebook 如何知道这些的?根据它所知道的和从 Experian 等处获取的数据,对你作出一些假设

这类数据随后可以用来以广告的形式定位 Facebook 用户。在 Facebook 做的这种定位告诉你很多关于他们隐藏在幕后的数据。例如,不仅可以通过位置/年龄/性别/语言,还能通过兴趣爱好和不同生活阶段(如刚刚订婚、6个月前订婚、早期学龄儿童)定位目标。如此过细地定位一个人是有可能的,而且还能达到一定数量(在我的例子中是 100-200 人)。

targeted.png

这些数据会被转卖到下游,通过信用卡和其它营销资源,与其它既存的关于你的数据混合在一起,从而创建类似这样的网站,试图建立你的完整个人资料。没有简单的方式来摆脱它,因为一旦创建了数据,删除它难上加难了。这就是为什么隐私活动人士最关心的问题之一是让公司每隔一段时间删除大量数据。

Facebook 也有权在广告里使用你和未满18岁孩子的照片

Facebook 给政府提供什么数据?

我们并不了解 Facebook 提供给政府的所有信息。Facebook 有一个政府报告页面,该页面自 2016 年6月以来没有更新过。但我们知道政府还在要求获取越来越多的信息

这些数据成为一份报告,报告显示了数据访问量和受影响的用户量,但没有提到任何关于所提供信息的类型、访问数据的机构类型(当地政府、州、联邦调查局/国家安全局)。

国家 用户数据要求总量 参考的用户账户总数 产生某些数据请求的百分比 内容限制 保存要求 保留的用户/帐号
美国 23,854 38,951 80.65% 0 31893 56714

马克·扎克伯格(Mark Zuckerberg)甚至发表声明

Facebook 过去不是,现在也从来没有参与任何让美国或任何其它政府直接访问我们服务器的计划。我们从来没有收到任何政府机构的一般要求或法院命令,提供大量信息或元数据的,据说 Verizon 收到过这样的要求。如果我们这样做了,会积极与之抗争。在昨天之前,我们甚至没听说过棱镜计划。

在这里,重要的是从字里行间读出的含义。直接访问服务器不是发送大容量文件的必要条件,也没有必要以此名了解棱镜计划

也很难知道国家安全局是否以其它方式从 Facebook 收集数据。至少在欧洲,有关此问题的诉讼正在进行中

但就目前而言,仅仅假设这种监控正在进行

退出 Facebook 后,Facebook 会跟踪什么?

在 Facebook 网站之外,Facebook 通过单点登录跟踪用户。

如果你退出,Facebook 也会通过 cookies 跟踪你。正如它们的隐私政策所述

当你访问或使用第三方网站和应用了我们服务的程序时,我们会收集信息。收集的信息包括访问的网站和应用程序、在这些网站和应用上使用我们的服务、以及网站或应用的开发者或发布者提供给你或我们的信息。

Facebook 也在试图跟踪或已经在跟踪你的光标在屏幕上的移动情况

早在 2011 年,如果你仍然登录着 Facebook, 它就开始跟踪你如何在网络上移动

未经你同意,Facebook 会记录你登录后所在网页的位置。Nik Cubrilovic 深入挖掘了一下,发现即使登出 Facebook 仍会跟踪你的位置。Facebook 否定了这一说法。

可以肯定的是,Facebook 收集你的浏览历史来丰富广告。

当我使用 Facebook 时应该考虑什么?

这一切意味着什么?从本质上讲,它意味着你在 Facebook 上做的每件事情,或是通过其它网站登录,都可能会被 Facebook 偷偷地跟踪并保留在服务器上。

需要明确的是,很多公司目前都会对用户进行某种形式的跟踪。除此以外,没有其它方式可以衡量经营活动。但是 Facebook 显然在一段时间内蹑手蹑脚地走出了道德上可接受的数据业务实践的范围。尽管 Facebook 目前没有做我提及的一些事情(抓取预发布内容、扰乱新闻订阅源),但它们也在做着非常相似的工作,而且没有隐私保障和,也不保证不用于实验。这也意味着即使你在 Facebook 并不活跃,仍会被跟踪。

每个像你这样的人发的帖子、添加的每个好友、签到的每个地方、点击的每个产品类别、每张照片,都会保存在 Facebook 并被聚合在一起。

如何聚合?很难描述。可能是社会实验的一部分,也许你的信息正被提交给政府部门;也许Facebook 的那些没有必要拥有此权限的员工可以访问你的页面、查看你的工作经历;也许相同的就业信息正被发送给保险公司。

这包括了所有的私人小组、封闭小组以及所有的消息。正如 Facebook 指出的,在 Facebook 不存在隐私这回事。

实质上,你需要加入 Facebook, 这意味着接受你做的每件事情都会被公开,或是被用于广告、政府机构分析。

如果不想让 Facebook 获取我的数据,应该怎么办?

Facebook 开始是大学生互相联系的一种方式,最终达到了改变人们行为、跟踪用户使用情况,并且可能为政府整合信息的程度。

问题在于无论谁是否使用 Facebook, 都牵涉到 Facebook 的跟踪、关系标签、影子档案系统。如果你是 Facebook 活跃用户,尤其如此。

因此,最重要的事情是意识到这种情况正在发生,并尽可能少给 Facebook 提供数据。

下列是我为了尽量减少在 Facebook 的曝光而做的事情。

并非每个人都会像我这样做。但最重要的是,即使你决定继续使用 Facebook , 也要知道Facebook 在使用你的数据做什么,并且有权在社交中作出权衡。

  1. 不要发布过多的个人信息。
  2. 不要发布你孩子的任何照片,特别是当他们处在无法同意的年龄。
  3. 当你用浏览器访问 Facebook 后, 退出 Facebook. 使用一个单独的浏览器访问 Facebook, 其它事情则用另一个单独的浏览器。
  4. 使用广告拦截插件。
  5. 组织或参与政治活动,不要使用 Facebook , 尤其是 Messenger 应用。如果你需要组织活动,用 Facebook 作为发起端,然后换用别的平台。推荐平台:Signal 是目前私密聊天的典范。Whatsapp 的群组聊天是可以的,但我不推荐它,因为它与 Facebook 的元数据系统紧密相联。电报(Telegram)也不错,但还不够好,因为它不是开源应用。此外,它取决于你的风险等级。这是有关这些平台更多信息。
  6. 不要在手机上安装 Facebook 应用程序,它会请求许多不合理的权限
  7. 不要在手机上安装 Messenger 应用。使用移动端网站。目前,Messenger 应用在移动设备上被屏蔽,可以在浏览器启用桌面版

很遗憾,做得如此好的社交网络在互联网上也是最糟糕的。但是,在人们远离这个平台或对它施加某种经济压力之前,任何都不会改变。

就我个人而言,作为一个数据专家,我个人所做的事情就是给发邮件给我的 Facebook 招聘人员发送以下信息:

亲爱的招聘专员:

Facebook 收集、使用数据的方式,包括:

这让我不仅强烈反对在 Facebook 工作,而且使我有力地评估了自己使用 Facebook. 因为我从来不知道输入这个系统的每个字符将如何被使用。

如果 Facebook 公司承诺要改变发展方向,并且

  • 利用数据来解决这些问题
  • 积极研究如何删除不必要的数据
  • 积极研究非政府干预的私人安全通讯
  • 并积极研究如何避免私人客户数据被共享给不必要的第三方

我很想知道。

谨启

Vicki

我们是社会性动物,我们想要连接、得到认可、分享、在其他人所在的平台上组织活动。目前而言,这是 Facebook 的优势。此外,很难说 Facebook 完全是坏的:它的确把人们联系起来,帮助组织聚会和活动,并且确实使世界更加互联互通。

但是,作为 Facebook 用户,我们和我们的数据是它的产品。而且,随着我们对这些数据的使用方式了解更多,我们仍然可以按照它的规则使用 Facebook,但要对它有所了解。

这里是黑客新闻讨论区。

翻译:我学会如何学习

原文:https://blog.safia.rocks/post/170003398180/how-i-learned-to-learn
作者:Safia Abdalla

我 11 岁时自学 HTML 和 CSS. 2 年之后,我用曾经学习 HTML CSS 的电脑,自学 Python. 又过了 4 年,在导师的帮助下,我学习用 Node 进行 web 后端开发。2 年后,一位朋友帮我在一个开源社区学习 React 等等。

尽管我进入过严格的预备高中学校、更加严格的大学,但我最满足的学习阶段是伏案我的书桌前,而不是在教室和报告厅。自主学习(independent learning) 已经成为我在技术事业上的切入口和特点。这点不仅适用于我,在我所处的特定行业的确如此。随着世界的进步日益加快,自主学习将成为追赶世界步伐的必需技能。

在这点上,我认为,当用「自主学习」这个词语时,定义其含义很重要。自主学习不是孤独一人学习(solitary learning)。我认为自主学习是一种区别于在大学这样的学术机构或者新兵训练营的学习。这种学习常常出现在当你拿起一本非虚构类书籍或者阅读一本关于新的编程框架的教程,或是在 Youtube 观看如何拧紧松动厨具的视频。自主学习可能是消极被动的,可以在没有目标的情况下学习,所以通过阅读社交媒体上的新闻报道或者收听电台(如果有人这样做)。自主学习也会是积极主动的,你制定了一项学习特定主题的计划,并且找出必要的资源。

过去 20 年里,我经历过的大多数自主学习已经成为「积极自主学习」(active independent learning). 不管是机器学习还是纺线编织,我会选择学习一个特定主题,并找出必要的资源。对于成为一个成功的、专注的自主学习者,我积累了若干经验,以下是我的分享。

了解你的(相反的)学习风格

和许多年轻人相似,我把自己有生之年的绝大部分时间用在了教室听课或是听报告。在这些状态里,我很少可以选择讲师的上课风格。从毫无生气的量子力学演讲到栩栩如生的人类学演讲,我已经见识了每种风格。若干年后,我突然明白了几乎没有一种演讲形式适合我。在我的学习过程中,我发现想明白怎样的学习风格不适合自己更切合实际。它帮助我知道要避免什么样的材料,以及最好地花费我的宝贵时间在何处。

旁注:我认为探索生命中的负面空间是一项经常被忽视的任务。很多时候,想明白什么没有作用,这和弄清楚什么奏效一样有用。

学习真正要学的内容

当你在学习一个新主题时,收集的信息里有大量干扰。尽管整个主旨问题与你的兴趣、目标有关联,但是在学习过程中搜集了大量不需要的信息。弄清楚真正要学习的内容的最好方式是请教该领域有经验者。通过 Twitter 联系导师或者在当地、办公室交谈,这是寻找愿意指导你完成学习过程的经验者的一种好方法。

反反复复(练习)

应用程序是用来巩固学习和理清思路的最好方式。如果你正专注于技术学习,你可能正在学习一门新的编程语言或者框架。我最喜欢的强化学习方式是重建以前在新语言或框架中建立的内容。不管是用新的 web 框架生成 Instagram 克隆版,或是把一个用户本地软件包从一种语言移植到另一种语言,把学到的知识运用到实践中,帮助我组建了获取的信息。

接受失败

正如前面提到的,我曾在一所预科学校读书。我是这些「天资聪慧的」孩子中的一个,他们把握那些在实验小学、高级中学教授的概念相当容易。当我进入大学,一切都改变了。突然,我成了大池塘中的一条小鱼。我初次遇到了真正有难度的科目。我亲自接受了它。但最终,我多次失败了,没有陷入残酷的自我瓦解之境,每当我没有立即理解概念的时候。(But eventually, I failed enough times to where I didn’t fall into a brutal pit of self-degradation whenever I didn’t grasp a concept immediately.) 这种安慰使我更容易推动自己更深入我的学习,从失败中恢复。

一般而言,在我的学习、生活中,优先权之一是接受失败(甚至有时要走出失败去寻找)。有时候,坎坷的道路是唯一值得经历的。

最后,我觉得将「用一生的时间去学习如何学习」这一事实内化(理解)是很重要的。学习是我们整个生命中一贯坚持的少数事情之一。它是人类的组成部分。就像我们学习、发现有关自身之外的世界一样,我们对自己的了解也同样多。