XMind ZEN 隐藏导出水印的方法

XMind ZEN 是继 XMind8 新出的思维导图绘制工具,两者功能差不多。

如果不考虑模板,一直使用免费版就足够了,但导出图片、PDF会自带背景水印。

下面讲解如何在不使用第三方奇奇怪怪的破解软件的情况下,如何去掉/隐藏水印。

系统:Ubuntu

软件版本:XMind ZEN 9.0.3

语言环境:English

第一步:下载安装 XMind ZEN

不多说,从 XMind 官网下载:https://www.xmind.net/download/

第二步:修改水印文件

XMind ZEN 在 Ubuntu 默认安装在了目录 /opt/XMind ZEN/,水印文件在 /opt/XMind ZEN/resources/app/out/imgs 目录下面,文件格式是 .svg

对应导出PNG图片、PDF、打印,需要修改的文件有:

  1. pdf-footer-en-US.svg
  2. png-watermark-en-US.svg
  3. print-watermark-en-US.svg

前两个文件用 gedit 编辑打开,删除所有内容并保存。

print 水印文件用 gedit 打开编辑,修改 opacity=0.2 参数,改为 0,就是全透明了,隐藏水印。

如果系统语言是中文简体,则分别修改结尾是 zh-CN 的文件。

儿童教育学科体系

翻译:大家忽视了「不要跟踪」隐私标准

原文是RIP “Do Not Track,” the Privacy Standard Everyone Ignored

作者:Chris Hoffman

「不跟踪」有一个崇高的目标:在每个浏览器中都有一个简单的选项,告诉网站不要跟踪你的浏览记录。原以为它的确做到了,但问题是:网站并不在乎这一点。

正如我们在2012年指出的那样,「不跟踪」选项并不能阻止你被跟踪。只要连接一个网站,它就会发送一条特殊的信息,要求网站不要跟踪。绝大多数网站忽略了这一点,从未真正改变。网站忽略请求不会得到惩罚,也没有理由尊重「不跟踪」的请求。

尽管如此,「不跟踪」已经拖了好几年。这个选项是 Google Chrome、Mozilla Firefox、Apple Safari、Microsoft Edge、Internet Explorer 浏览器的一部分。如果你因为在网上被跟踪而感到沮丧,那么可以勾选这个选项,可能会让你感觉好一点,但实际上这是误导,什么也没有做。

事实上,「不跟踪」已经被用来跟踪用户。如果你已经启用了「不跟踪」,那么关于你的额外信息就会被跟踪了。例如,广告商可以此投放与隐私相关的广告。

一段时间以来,每个人都满足于忽略这个毫无用处的选项,但现在看来 DNT 终于崩溃了。正如 DuckDuckGo 提醒,苹果公司正从 Safari 浏览器移除「不跟踪」设置项。就像 Gizmodo 发现的那样,DNT 标准讨论工作在2019年1月17日悄然结束。随着标准被放弃、第一个浏览器移除它,我们希望其它浏览器开发商也能追随苹果的脚步。

这样不好吗?不。「不跟踪」从没有消失,但被网站忽视。在这一点上,「不跟踪」选项起到了安慰剂的作用,仅仅通过显示「不跟踪」误导用户。去掉 DNT 已经是很久以前的事情了。

「不跟踪」的发展历史是混乱的。微软只是让问题变得更糟糕,2010年,IE10 默认启用了这个功能,导致更多网站忽略了它。这点特别有趣,因为微软从来就不遵守 DNT 设置,换言之「因为对于如何解释 DNT 还没有达成共识,微软服务目前没有对浏览器 DNT 作出反应。」

包含跟踪保护功能的当代浏览器不会等到业界达成「共识」之后才开始跟进。相反,他们主动屏蔽追踪器。苹果的 Safari 浏览器含有「智能跟踪保护」,可以避免没有直接访问的网站跟踪用户。Mozilla Firefox 提供了一个内容拦截功能,可以拦截已知的跟踪器。

这并不是说跟踪或定向广告一定是坏事。有支持也有反对的理由。但是,作为一个团体,我们应该讨论它,而不是用一个误导性的选项分散注意力,因为它实际上什么都没有做。

资源|E-Learning 3.0 MOOC

E-learning 3.0 第五节课的话题是资源(resources)。

内容概要如下:

从早期开始,互联网就将分享的理念和更多消费驱动的内容消费模式进行了对比。新闻网、邮件列表、网站和文件传输服务便于交换想法和信息。

这些早期网络越来越被锁定,人与数据之间曾经无缝的交换被越来越多锁定在付费墙和内容孤岛上。web3 意在很大程度上对抗这个现象,并且互联网上的开发者正研发一种新的基础设施,它将反抗封闭的努力。

这些技术建立在过去文件共享网络的一些基础上,但是增加了凸显它们集中控制和监管弱点的要素。其中一个例子是 IPFS(Interplanetary File System)和它的同类 IPLD(Interplanetary Linked Data)。这些新的文件共享系统不是依靠互联网地址定位内容,而是使用数据或内容的哈希值(hash)作为地址,使数据分布在云端,可以从最便捷的源头访问。

我们已经看到更多传统的内容,例如书籍、媒体和音乐,通过 IPFS 分布。类似的技术正被用于支持更复杂的内容。例如分布式应用(dApps)、订阅、列表、协议网络(contract network),甚至 DAO(decentralized autonomous organization)分布式组织。由于没有中心点,没有任何办法控制这些类型的内容,从而引起对其合法性和漏洞的质疑。

这些概念被用于介绍一种新型开放教育资源(OER,open educational resource)、教育内容可寻址资源(CARE, content addressable resources for education),以及 CARE 和 CARENet 的相关概念。

这些资源可能是从课程和程序到事件访问和录制到上述一些高级学习应用程序的任何内容,将通过内容可寻址网络打包和分发,因此,它们永久开放,不可能被商业服务封闭。由于不变性、哈希寻址过程的特点,确保了创建的内容就是接收到的内容。

教育内容可寻址资源的概念解决了开放教育资源(OER)可持续性问题,因为老师和学习者的分布式网络通过他们的使用来维持它们。

它还创建了将数据、媒体、软件和人连接起来的资源图形的创建机制,重新定义了我们对开放课程(开放教学法)的观点,不是由许可证和机构主导,而是由人和做法主导。

IPFS/Beaker Browswer 安装方法

创建分布式资源网络的工具:IPFS, Beaker Browser, Fritter.

Fritter 是类似 P2P Twitter 的应用程序, 它通过 Dat访问,目前可以使用 Beaker 浏览器打开。

这个视频是关于如何在 Windows 系统安装 IPFS. 如何添加一个网站到 IPFS 可以参考这个视频

安装 Beaker Browser 并创建网站的方法: https://www.youtube.com/watch?v=8pTE4KCzzRc

使用 Dat 分享内容的方法,以 Dweb 为例:https://www.youtube.com/watch?v=8KpqKWMZcIk

Twitter 收藏的各种资源整理

视频类

国际非暴力冲突研究中心(@civilresistance)推出五部精彩的关于非暴力抗争的纪录片,分别是《一种更强大的力量》、《橙色革命》、《推翻独裁者》、《面对真相》、《埃及:被打断的革命?》,并有包括中文在内的20多种语言的配音。请收藏、观看、传播。免费。https://www.nonviolent-conflict.org/icncfilms/ (from @tengbiao)

给各位推荐近期不错的片子 : 解除好友2 :暗网 技术宅大力推荐 磁力magnet:?xt=urn:btih:9BABF843AC5247DB7CBBF46C1D0CC14E04FA1387 (from @886106)

一个新的纪录片推荐 ‘Free Speech, Parler Sans Peur’(后半句的意思是‘毫无恐惧地说话’) 在这里看到更多:https://www.jupiter-films.com/film-free-speech-parler-sans-peur-95.php (from @DonEvansWm)

『最后的棒棒』一口气看完这部纪录片,真是精彩!我喜欢的看点到不是弱势群体,底层惨状,中国梦反差萌…之类表象。而是这片在以真实为基准之上展现的人性与戏剧性,即便是位高权重者,富有者,一样逃不开片中那些真实而连续的人生里的因果循环。https://www.bilibili.com/video/av22517607?from=search&seid=14283108750748647806 (from @tanxinbuzu)

160分钟版芙蓉镇Hibiscus Town.1986.DVD.X264.AAC.HALFCD https://youtu.be/5VL5WPZGVH0 (from @appiredicry)

上周末看完《民主:沉醉在数据中》,这部关于今年5月份实施的GDPR条例出台始末的纪录片,权衡各种政治、司法、经济利益、公民权益的过程挺值得一看的,没记错的话应该也是斯诺登第二次真人出镜。摄制组也是史无前例的获得欧盟的许可,全程纪录下该条例的诞生。 B站德语中字:https://www.bilibili.com/video/av6675249/ … (from @LaoTieNoProblem)

英國另一份重要的知識份子雜誌「倫敦書評」這一期很特別:只有一篇文章,是關於去年Grenfell Tower 大火的反思。網站上有全文,還有一支將近一小時的紀錄片。我可能沒有心力看完,但是對於這個企圖很有興趣 Andrew O’Hagan in the LRB: https://www.lrb.co.uk/v40/n11/andrew-ohagan/the-tower via @LRB (from @soundfury)

“The push for STEM-based education in this country is fierce. It’s in all of our faces. And this is a colossal mistake.” @ericberridge https://www.ted.com/talks/eric_berridge_why_tech_needs_the_humanities (from @TEDTalks)

“We cannot have a society in which, if two people wish to communicate, the only way that can happen is if it’s financed by a third person who wishes to manipulate them.”https://www.ted.com/talks/jaron_lanier_how_we_need_to_remake_the_internet

“As long as my phone is turned on, my location can be tracked.” http://t.ted.com/OZ0DOAn

7 years ago, I talked with @jimmy_wales about collaboration https://www.youtube.com/watch?v=PlFUf-KwYjM&t=5s

数字馆藏类

康奈尔大学的 Macaulay Library,号称全世界最大最久(自1929)的动物叫声资料库(也包括视频资料),收藏了近67%世界鸟类的声音,该大学的鸟类实验室将这批音视频资料进行了数字化并发布:http://macaulaylibrary.org/ 。包括9000物种的15万音频。

中研院歷史語言研究所製作的「近代史數位資料庫」的網站風格太贊了 http://mhdb.mh.sinica.edu.tw/index.php

斯坦福大学图书馆发布了 EarthWorks ——新的GIS数据发现系统,支持多种途径检索和浏览来源于斯坦福大学图书馆及其他机构的GIS数据。 入口:https://earthworks.stanford.edu/

因见人数次提及,很想读一下郭沫若的《读〈随园诗话〉札记》,搜到一册非常清晰的PDF版《郭沫若全集文学编》第十六卷,其中包含了该札记及文艺论集续集:http://memory.scu.edu.cn/UploadFiles/pdf/%E9%83%AD%E6%B2%AB%E8%8B%A5%E5%85%A8%E9%9B%86%E6%96%87%E5%AD%A6%E7%BC%9616.pdf …

“中英文图书数字化国际合作计划(CADAL)”现有成果:7.8万册电子书,中文古籍,600dpi分辨率。 https://archive.org/search.php?query=%28sponsor%3A%22China-America%20Digital%20Academic%20Library%20%28CADAL%29%22%29%20AND%20-mediatype%3Acollection&sort=-avg_rating%3B-num_reviews

10000+ 报纸分布世界地图: http://newspapermap.com 。以颜色区分语种,嗯,汉语被归在了“Other”里。via @newspapermap

一个关于歌川广重木刻浮世绘的网站:http://www.hiroshige.org.uk/index.html 。作品收集得很全,描述清晰。妙的是,创建者是一个既不懂日语也非艺术专业的人,对于何以会做这样一个网站又缄口不言,不禁让人揣想背后的故事。

http://ecoexplorer.arcgis.com/eco/ USGS(美国地址勘探局) 和 Esri(环境系统研究所) 联合制作发布的最详细的高精度(250米)全球生态在线地图工具。

Expedia Viewfinder 数据库最近发布了一个beta版图片库( Expedia Viewfinder Image Library, http://www.expedia.com/pictures/ ),包含4万高清旅游照片,可供创作者们免费使用。嗯,这个横移页面够鲜亮。

为纪念莎士比亚去世400周年,最大最权威的莎士比亚资料在线展览 “Shakespeare Documented” 于1月20日发布,包含与莎士比亚生平与作品相关的图片,抄本,文档,在他生前及去世后不久提及他的各种参考文献等。 http://www.shakespearedocumented.org/

由波音公司赞助,《美国航空周刊与航天技术》(Aviation Week & Space Technology)杂志将其100年来的4500期约50万页内容数字化并免费开放(1916-2016):http://archive.aviationweek.com

WDL 世界数字图书馆 http://www.wdl.org/ 真是太酷了!比如这个世界地图的分类下 http://www.wdl.org/zh/search/?additional_subjects=World%20maps 把各个文明对世界地图如何接纳的历史都呈现出来,而且这些珍贵的原始资料的数字版本都可以自由下载!必须赞!

19世纪被称为书籍插图的黄金时代。“Old Book Illustrations”这个网站扫描了19世纪至20世纪初公有域老书刊的优秀插图,供免费下载:http://www.oldbookillustrations.com/ 。图片高清,按主题、画家分类,可检索题名,质量超赞。

奥斯丁家族收藏的乐谱,有印刷本,有手稿,共18册,目前被南安普顿大学图书馆数字化了,扫描效果很好:https://archive.org/details/austenfamilymusicbooks 。cc 音乐爱好者。

论书籍数字化之精美和不惜成本,莫过于梵蒂冈数字图书馆,现在该网站已经有5300珍稀数字化手稿发布了:http://digi.vatlib.it/

哈佛美术馆制作的包豪斯艺术作品时间线:http://www.harvardartmuseums.org/tour/the-bauhaus/slide/6338 … ;该馆已将约3.2万件包豪斯风格艺术品制作为在线馆藏,可从各种角度检索浏览:http://www.harvardartmuseums.org/collections/special-collections/the-bauhaus …

大英图书馆的“泥金装饰手抄本(Illuminated manuscript)目录”,收录该馆藏中世纪及文艺复兴时期手抄本中的装饰页及其说明,若是搜索及呈现功能更好用些就好了。http://www.bl.uk/catalogues/illuminatedmanuscripts/welcome.htm …

Internet Sacred Text Archive Home,收集关于宗教、神话、传奇、民俗、神秘学等主题的在线电子书库,每种包括英文版,并尽可能提供原文。一个“古老”的网站,1999年就上线了。http://www.sacred-texts.com/index.htm

免費下載佛洛伊德著作的電子書與有聲書 http://bit.ly/23AgkW4

来自彩色玻璃艺术家 Henry Belcher 和他的公司1886年出版的马赛克玻璃目录,真的很美。 http://publicdomainreview.org/collections/catalogue-from-belcher-mosaic-glass-co-1886/ …

大都会艺术博物馆出版的457种艺术书籍于 MetPublications 门户网站免费开放了:http://www.metmuseum.org/art/metpublications/titles-with-full-text-online?searchtype=F … ,可以下载,也可以在 Google Books 上浏览全文。

MIT 媒体实验室与 Deloitte 及 Datawheel 联合开发的数据挖掘与可视化工具:Data USA(http://datausa.io/ )上线,可从各个角度展示与分析美国政府开放数据。

Rgoers 的世界玫瑰月季类百科全书( http://www.rogersroses.com/ ),收录5000种玫瑰,提供6000幅图片帮助辨别种类,网站内容由玫瑰专家 Roger Phillips 和 Dr. Martyn Rix 小心维护编辑。

美国国会图书馆将其数字馆藏中无任何版权限制的高清内容做了个专辑——Free to Use and Reuse Sets:https://www.loc.gov/free-to-use/ ,分若干主题,包括海报、历史照片、资料图片、童书绘本、插画、浮世绘等等。我觉得每个数字馆藏大户都应该把无版权限制内容单列一下。(from @yun_chuang)

芝加哥艺术博物馆将其4.4万+艺术作品的高清资源发布到新版官网上,以CC-0协议开放获取,可任意下载。比较赞的是,每一幅作品都附有详细介绍、作者小传、来源、相关音视频资料、参考文献等。https://www.artic.edu/collection (from @yun_chuang)

科幻百科全书Encyclopedia of Science Fiction:http://www.sf-encyclopedia.com/ ,免费开放,包含17,500余词条。1979年出版的第一版科幻百科曾获1980年非小说类雨果奖。1993年出第二版,1994年又获雨果奖。2011年发布线上版本。现在的是第三版。(from @yun_chuang)

Independent voices,开放获取资源,1951-2016独立/另类/激进出版物数字化集合,包括报纸/杂志/期刊,反战、女权、LGBT、黑人运动等,整合自美国、加拿大、英国多家机构,目前已收集 15,401期。https://voices.revealdigital.com/cgi-bin/independentvoices?a=p&p=home&e=——-en-20–1–txt-txIN—————1 … (from @yun_chuang)

普林斯顿大学图书馆数字化项目:30幅中国辛亥革命时期稀见木刻版画,高清。http://pudl.princeton.edu/collections/pudl0030 (from @yun_chuang)

Chine Ancienne,一个关于中国历史习俗宗教圣贤艺术文学等的法文数字图书馆。公有域,免费下载(pdf/doc)。看起来像是个人所建,主人引了句名言:“当你沉浸在中国人的世界,你不能走了!”(Quand vous serez plongé dans l’univers chinois, vous n’en sortirez plus !)https://www.chineancienne.fr/

芝加哥大学出版社2018新版美国史教科书:Building the American Republic 全文免费阅读下载 http://press.uchicago.edu/sites/buildingtheamericanrepublic/index.html … (from @ideobook)

普林斯頓大學葛思德東亞圖書館还有一个皮影形象数据库(Chinese Shadow Figures Catalog):https://library.princeton.edu/eastasian/shadowfigures/index.php?pageNum_Shadow=0&totalRows_Shadow=2264&search= …

首都博物馆古籍插图图像数据库 http://query.clcn.net.cn/GJAndST/gjct1.htm …,包含古籍插图数据一万条。用到的3次中有1次帮上了忙。这些插图从首图馆藏古籍文献中拣选制作,每条包括插图全文影像和内容标引。可惜图片精度不高,内容揭示也比较粗糙,范围仅限一馆之藏,未免狭窄些。真的应该有一个更大更精更博的插图库啊。

这个很好玩:国际日本文化研究中心的妖怪画像数据库 http://www.nichibun.ac.jp/YoukaiGazou/index.html … ,可按名字和特征检索。

推荐一个偶遇的网站:漢語多功能字庫:古文字繫形、形義通解、英漢索引、粵語審音配詞。 http://humanum.arts.cuhk.edu.hk/Lexis/lexi-mf/ 香港中文大學人文電算研究中心建设,共收錄逾13800字,其中1060字有甲骨文,2059字有金文,1087字有簡帛文字,960字有其他古文字,7271字小篆等。页面布局利用率很高。

《中国历史地图集》全八册在线公开 http://www.ccamc.co/chinese_historical_map/index.php …

生态学鼻祖 Ernst Haeckel (恩斯特·海克尔)1904年初版 Kunstformen der Natur (Artforms of nature,自然的艺术形态) 中的100幅精美插画,高清图片在维基共享资源中(https://commons.wikimedia.org/wiki/Kunstformen_der_Natur … ),有人做成了顺滑缩放版:http://algorithmic-worlds.net/Haeckel/haeckel.php …

大英图书馆新上线子网站,发布了数字化的1300珍贵希伯来手抄本,支持希伯来文与英文双语检索。好华丽。British Library publishes treasure trove of Hebrew manuscripts https://www.timesofisrael.com/british-library-publishes-treasure-trove-of-hebrew-manuscripts/?utm_source=dlvr.it&utm_medium=twitter …

费城伯恩斯美术馆最近数字化2000+印象派、后印象派及早期现代杰作(约为其馆藏一半),并免费开放:https://collection.barnesfoundation.org/ ,其中1429幅可下载高分辨率图片。

著名学术出版社 De Gruyter 最近发布了一个新网站 Science Discoveries ,用来展示科研方面的最新进展,主要聚焦于医学,健康,环境,技术,生物等领域。https://sciencediscoveries.degruyter.com/

汉籍电子书库(漢リポ Kanseki Repository) :https://www.kanripo.org/ 。日本人做的汉籍库,分经史子集道佛六类。经史子集以文渊阁四库全书为本,文本与影印页面对照,可全文搜索。开发托管于GitHub,已上传古籍9040种。

史密森尼艺术博物馆将其20万件藏品数字化,令3000年设计史可在线浏览:https://collection.cooperhewitt.org/ http://www.openculture.com/2017/09/the-smithsonian-design-museum-digitizes-200000-objects.html … 来自 @openculture

Google Arts & Culture 新创建的项目“We Wear Culture”,集成了40个国家的时尚、纺织、服装艺术数字资源,跨越3000年历史,包括一些华丽的全景展示,看起来很有趣。https://artsandculture.google.com/project/fashion

国图网络注册用户可远程访问的电子资源越来越多,包括古籍数字善本、民国图书、东京大学东洋文化研究所汉籍影像、宋人文集、国际善本联合目录及大量外文数据库资源等。所以整理了关于国图网络用户注册、权限、资源等系列问题,如果有人需要:https://workflowy.com/s/2Xwnb9s7Ve

台湾华文电子书库Taiwan eBook启用上线,电子书1万3,778册,包括1911-1949年图书1万2,178册、政府出版品595册、百人千书1,005册,免费开放读者线上阅览利用(无需翻墙,但首次打开速度较慢 http://taiwanebook.ncl.edu.tw/zh-tw

技术/工具类

这个名为Everything的本地全盘搜索工具好用,有绿色便携版,中文语言包,推荐。 http://www.voidtools.com/

EpubPress 實測後完全可用。將多個瀏覽器分頁的內容整合成一本電子書;除了下載檔案外,還可以勾選格式與電郵,直接寄送給 Kindle 與多看,一分鐘就收到而且格式呈現也不錯。 https://bookfere.com/post/565.html

Debian/Ubuntu 系统下有个名为 gdebi 的软件包,可以自动解决安装的deb软件包时的依赖问题。https://packages.debian.org/search?searchon=names&keywords=gdebi (from @chenshaoju)

自学式手册《数字安全实用手册》的网站http://practicaldigitalprotection.com

保护 SSH 端口的多种方法:http://www.hackingarticles.in/multiple-ways-to-secure-ssh-port/ (from @APTp0)

让 YouTube 实现双语字幕的 Chrome 扩展。https://github.com/muzuiget/dualsub-supports (from @muzuiget)

「理解数字世界中的纸张|PDF 科普」:https://sspai.com/post/47092 (from @AlanDecode)

Arctime 是一个全新理念的可视化字幕创作软件,可以运行在Mac、Windows、Linux上。精准的音频波形图,可以快速创建和编辑时间轴,可以高效的进行文本编辑、翻译。支持SRT、ASS外挂字幕格式,并可以通过交换工程文件或与伙伴协同工作。字幕编辑完成后,需单击“视频转码”按钮,即可轻松完成字幕压制工作。

发现一个很有用的工具网站,把可执行文件传上去,立刻用65种反病毒软件扫描一遍,更棒的是在Behavior页里有此程序在两种沙盒里的行为表现,简直通透。 同时还可以扫描URL。 推荐 网站:https://www.virustotal.com (from ZeaIYi)

Anbox 是一个 Linux 系统运行安卓应用的容器,理论上把安卓应用安装在任何 Linux 系统,但是目前只支持 Ubuntu。https://anbox.io/ (from @ruanyf)

科学上网指南——Wireguard:https://eddyemma.com/blog/2018/08/26/科学上网指南-wireguard/ (from @zhang_cong) https://doub.io

前两天开源的《计算机网络:系统方法》,我做成电子书了,后面网址下载。https://github.com/ruanyf/book-computer-networks (from @ruanyf)

Docker 是个划时代的开源项目,它彻底释放了计算虚拟化的威力,极大提高了应用的维护效率,降低了云计算应用开发的成本!使用 Docker,可以让应用的部署、测试和分发都变得前所未有的高效和轻松!Docker](https://twitter.com/hashtag/Docker?src=hash) 入门教程在这里。https://github.com/yeasy/docker_practice/blob/master/SUMMARY.md (from @huangjinbo)

2018年信息安全从业者书单推荐,重得阅读一下。https://github.com/riusksk/secbook (from @huangjinbo)

做了一个颜色预览以及配色生成工具 Colorless,可以实时预览 iOS/Android/Web 的配色效果。https://colorless.app/ 我以前很长时间内都不知道如何使用颜色,看了很多关于色彩的书和文章后,还是决定用算法来计算颜色,而不是用我的艺术思维去创作。然后今天把我积攒的方法论做成了一个工具。(from @waylybaye)

Data Miner 真的是爬網頁資料的神器。不需要寫程式,略摸一下 jQuery Selector 的規則多試幾次就好;選擇好資料欄位、自動翻頁繼續抓、甚至用簡單 JS 清理分割一下資料,都在 Chrome 裡完成,萬用。https://data-miner.io/ (from @wastemobile)

微软的团队协作工具 Teams 推出免费版了,可以聊天、视频、上传文件、内部集成了 Office。https://products.office.com/en-us/microsoft-teams/group-chat-software (from @ruanyf)

Editoria 是 Coko 替加利福尼亞大學出版社開發的線上出版系統,由好幾個同樣是他們開發的開源組件特調而來,功能與流程都非常紮實,編輯與作者協作、紀錄變更、編注都有;輸出 EPUB 與 IDML 都在開發計畫線上。 [https://editoria.pub/]https://editoria.pub/) GitLab https://gitlab.coko.foundation/editoria/editoria (from @wastemobile)

安全手册:这里是你需要的几乎所有安全上网工具;以及为什么建议不要使用以美国为基地的网络服务; 为什么Win10 是隐私噩梦? privacy https://steemit.com/life/@iyouport/7nfymr

《Linux 就该这么学》PDF 版本官方下载地址:https://www.linuxprobe.com/book (注意需要关注微信公众号)。 (from @huangjinbo)

自动生成背景图片的工具网站,现在提供五种风格,每种都可以定制,看上去赏心悦目。https://coolbackgrounds.io (from @ruanyf)

Android 手機畫面投影 Windows 10 免接線、免 App、免網路 https://www.playpcesor.com/2018/05/android-windows-10-miracast.html (from @esorhjy)

对于Windows用户,如果需要彻底清除U盘或硬盘,且不想使用第三方软件的,可使用 format X: /p:Y 命令,其中 X 为需要格式化的盘符, Y 为清零的复写次数,建议不低于三次。如果要更加安全可靠的清除,可使用开源免费的Eraser软件: https://eraser.heidi.ie (from @chenshaoju)

如何恢复被删除的微信聊天记录 https://www.solidot.org/story?sid=56338 //光卸载微信是没用的,真正要彻底清理的话(Android),要么Root手机用dd命令擦除userdata分区,要么卸载微信,删除 /sdcard/tencent 目录后用第三方App复写存储空闲区域: https://play.google.com/store/apps/details?id=xyz.rodit.fshred (from @chenshaoju)

https://www.portablefreeware.com/all.php Portable Freeware Collection 如果要找一些Windows的小软件的话,这个网站挺不错的。(from @cathayan)

装了 iNaturalist(一个自然观察与物种记录网站)的物种识别 App(https://www.inaturalist.org/pages/seek_app ),通杀动物植物真菌界,且看其效果如何。——其实我这个脸盲症患者不是更需要人脸识别应用吗? (from @yun_chuang)

想学 Markdown?这篇文章帮你快速上手 http://sspai.com/post/43866

根据 VPN Leak 这篇文章的介绍,即便使用 VPN,在浏览器启用 WebRTC 的情况下,用户的真实 IP 仍然有可能被泄漏。要检测你的真实 IP 是否被泄漏,可访问:https://ip.voidsec.com (https://voidsec.com/vpn-leak/ ) (from @linuxtoy)

凑巧发现了Cloud Torrent这款开源软件,试了一下,发现效果意外的不错,功能: BT下载 磁力链接下载 上传BT文件 离线下载 边下边播 面板操作 文件会离线下载存储到VPS上,然后你可以下载到电脑本地… 软件地址:https://github.com/jpillora/cloud-torrent … Doubi一键脚本: https://doub.io/wlzy-12/ 个人建议安装原版 (from @CrazyJal)

两个很好的初学者教程:《四分钟学 CSS》 https://jgthms.com/web-design-in-4-minutes/ … 《十四分钟学 JavaScript》 https://jgthms.com/javascript-in-14-minutes/ (from @ruanyf)

有興趣的可以試試 BookFusion 電子書管理服務(免費) https://www.bookfusion.com 不管 ePub 或 mobi,拖進視窗就可上傳、集中管理;設定好 Send to Kindle 電郵之後就可自由傳送,它會自動轉換格式(這點很棒)。中文沒問題,Android 閱讀軟體比 iOS 的好,劃線註記功能也都有。

CSS 垂直居中的最简单写法:容器元素设为 flex 布局,子元素只要写 margin: auto 即可。

1
2
3
4
5
6
7
8
9
10
11
<header>
<h1>A secret weapon..</h1>
</header>

header {
display: flex;
height: 100vh;
}
h1 {
margin: auto;
}

LightPDF 線上轉檔Word、編輯 PDF,免費無檔案大小時長限制 http://www.playpcesor.com/2018/02/lightpdf-word-pdf.html

一个可以让你下载20多个网站视频的网站,不需要什么插件与客户端,只要播放地址既可以给你真实下载地址,绝对值得收藏。什么YouTube.Facebook.汤不热上的视都不是事。https://savieo.com

The Greek Alphabet - Cheat sheet for reading formulas in Machine Learning, Economics, and Finance. 附:如何在 Ubuntu Linux 下用 ppmtopdf 将PDF转换为图片 http://t.cn/RRrZBzG

那个可以获取「学术论文」的 SciHub 进化 3.0 版本,拥有了易用的图形界面 http://ift.tt/2mLe6aK

最近看的两篇和 iCloud 有关的文章:《科普:进一步了解 iCloud「照片」、「照片图库」和「照片流」》 https://sspai.com/post/31553 和《不想停用 iCloud?不妨迁移数据到其它 Apple ID》 https://sspai.com/post/42766 可以说少数派真的汇集了中文圈最优秀的相关领域作者了,比 Apple 官方文档写得还详细。

Self-hosted Server 新增 Web 应用:Lychee。Lychee 是一个好看又好用的照片管理工具,包括专辑归类、与朋友分享、选择是否公开/私有、支持 EXIF/IPTC 元数据、导入等不错的功能。(https://selfhostedserver.com/features / https://lychee.electerious.com)

你遇见过网页由于要下载字体,导致内容一片空白吗? CSS 现在有一个新属性 font-display,可以解决这个问题,从而可以放心地在网页加载字体了。 https://font-display.glitch.me/

【可视化小百科+工具箱】Google News Lab与一家可视化制作公司Adioma合作,将市面上出现的所有可视化都进行了分类:图表、相关书籍和工具。读者们可以在这个小宇宙页面上,看到三大类代表的星球独立自转,简洁明了,奇趣又美观。https://buff.ly/2AlLzgI

【不会编程,也可轻松学地图可视化】CartoDB是一款开源网络应用程序和交互式地图制作工具,以提供“一键式制图”功能闻名。起初CartoDB和数据新闻相差千里,是两名西班牙研究生物多样性和自然保护的科学家为了更好展示研究成果而建立的。https://buff.ly/2CovJ6e

Git In Practice:面向中到高级用户的 Git 图书,原由 Manning 出版,现由作者开源到 GitHub 供免费阅读。(https://github.com/GitInPractice/GitInPractice)

小知识 很多人不知道 text-decoration-color 和 text-decoration-style,可以设置下划线的颜色和样式。(来自@AllThingsSmitty

1
2
3
a:link {
text-decoration: green wavy underline;
}

如果你还在使用 tinypng 压缩 PNG 图片,可以考虑改用 upng。它的压缩率更好,还可以调节图片清晰度,换取更小的体积。http://upng.photopea.com/

【ProPublica数据学院】自Propublica数据学院开办两年以来,已有千余人报名参加,每年平均录取12人。无法参与实体课堂也没关系,学院录制了5门课的教学视频,分别是编程基础、网站运作、HTML、CSS基础和进阶。教学链接:https://buff.ly/2z33sDu

网课类

OpenCourseWare是MIT麻省理工学院在2002年发起的公开课项目,旨在向全世界的学生和教育工作者提供免费的在线课程和教材下载等,许多课程还附现场视频讲解,非常不错的项目,对于学习各类知识都有帮助。 网址链接 https://ocw.mit.edu/index.htm (from @GavinLeely)

其它

一些开放的 Trello:https://trello.com/b/Ke3fB31A/skoryxs-art-queue (from @ooof)

推荐一本英文的数学教材《进入纯数学》,免费下载。 从简单的自然数讲起,包括代数、数论、集合、概率和微积分等章节。我觉得,至少对于了解数学的符号体系很有好处。https://infinitedescent.xyz/ (from ruanyf)

有人收集了一份书单,推荐各个领域的经典教科书 https://www.lesswrong.com/posts/xg3hXCYQPJkwHyik2/the-best-textbooks-on-every-subject … (算法方面推荐了算法导论,我还是更推荐 Sedgwick 的那本)(from @zellux)

后知后觉,才发现 Adobe 旗下的全球创意设计类作品聚合平台 Behance, 多种语言支持,多数作品遵循CC协议,允许非商业使用(当然要保留署名说明出处),找素材好去处:https://www.behance.net/ (from @yun_chuang)

MeeToo in China 前段时间公益行业性暴力事件频发,鑑於较少有专业的机构和师资能开展性骚扰专题方面的培訓,性教育機構玛丽斯特普查阅资料并根据机构内部的制度作了一个培训方案,並面向社會提供免費下载:http://www.mariestopes.org.cn/xizai/download.php?class2=157 (from @agaguk)

最新一期的Foreign Affairs值得收藏。 以“互联网之战”(World War Web)为主题编录的系列文章讨论了中国成为互联网大国对世界的威胁和影响、印度网络事业的独特发展道路、欧洲对互联网个人数据和隐私的管控、美国社交媒体对民主选举的影响、大型科技公司的商业和社会责任等。https://www.foreignaffairs.com/articles/2018-08-14/world-war-web (from @kuriko_c)

What do we know about the autism brain? Brain tissue research made these findings possible. To learn more about the latest findings on the autism brain, visit http://takesbrains.org/signup to sign up for the Autism BrainNet newsletter. (from @AutismBrainNet)

为了尽可能地打造一个信息透明、多元化且高水平的产品技术团队,我编写了、并会发给部门内每个新人一份《丁宇的共事指南》,也就是所谓的“Manager Readme”:https://drive.google.com/file/d/12e7WwZSm1RUiiO2C3JhLKEnFgW_IOSIE/view (from @felixding)

偶遇一个个人创办的电子书分享网站:周读,每种书通过百度网盘分享,提供Kindle电子书及txt、pdf、epub格式,书籍种类较杂,有新有旧,排版质朴。可用来救急。http://www.ireadweek.com/index.php/Index/index.html (from @yun_chuang)

800亿像素城市摄影系列,目前已经发布的城市: 北京:https://www.sigoo.com/beijing-skyline-360-panorama-on-central-radio-tv-tower … 广州:https://www.sigoo.com/guangzhou-tower-80-gigapixels-panorama … 天津:https://www.sigoo.com/tianjing-360-panorama-on-tianjing-tv-tower … 郑州:https://www.sigoo.com/zhengzhou-360-panorama-on-qianxi-plaza … 哈尔滨:https://www.sigoo.com/harbin-360-panorama-in-the-winter … 石家庄:https://www.sigoo.com/shijiazhuang-360-panorama-on-tv-tower … 贵阳:https://www.sigoo.com/guiyang-360-panorama-on-dongshan … (from @chenymail)

一些分辨率术语的含义 - 720p: 1280 x 720, 称为 HD - 1080p: 1920 x 1080, 称为 FULL HD - 1440p: 2560 x 1440, 称为 QHD 或 Quad HD,即4倍的HD - 2160p: 3840 x 2160, 称为 4K - 4320p: 7680 x 4320, 称为 8K https://medium.com/@yashwate07/explained-1-display-resolution-11a67a6096c (from @ruanyf)

香港中文大学的《二十一世纪》杂志,原来都已经可以网上免费阅读了。。幸福。。 每一期都有很多好看的文章,创刊三十年积累了很多优秀文章,中文世界里相当优秀的杂志了。http://www.cuhk.edu.hk/ics/21c/zh/issues/index.html (from @wuyagege)

@JZ周峻纬 http://www.comh.ca/antidepressant-skills/adult/resources/index-asw.cfm 《抑郁自我护理手册》,为那些没有条件寻求心理干预的人准备。 BIlsker教授几十年行医经验和科研结果的总结,专门为非专业人士准备,避免了使用专业词汇和生僻词语。 点开后找到Chinese simplified就可以打开简体中文版。以上资源免费,已通过作者本人授权。(from @knifepoint)

I wrote this in 2010 about attention & other 21st century literacies; I’m usually around 10 yrs too early, so it’s about right for now:https://er.educause.edu/articles/2010/10/attention-and-other-21stcentury-social-media-literacies (from @hrheingold)

中文版《独裁者手册》之和谐手册:https://kesalin.github.io/blog/2015/03/26/miss-of-the-dictatos-handbook

網路大數據與個人隱私自決 from Medium http://bit.ly/2puqBch 但主要是想推這本報告《Network of Control:A Report on Corporate Surveillance, Digital Tracking, Big Data & Privacy》,跟著文內連結可以下載免費英文全文 PDF。

四个简单方法,从今天开始戒糖: https://cn.nytimes.com/health/20180320/4-easy-ways-to-cut-down-your-sugar-intake

新加坡居然登记了每一棵树,目前全国共有56万4266棵树。 而且,还可以下载 JSON 文件,里面是每棵树的坐标、年龄、生长速度等数据。(via @cheeaunhttps://www1.nparks.gov.sg/trees

Learn-Anything 這網站很有趣、野心很大,希望讓有心想自學任何知識的人,都能搜尋獲得「學習路徑」,那些有前後關聯或必要性,甚至不會出現在一般搜尋引擎的資源。 https://learn-anything.xyz (from @wastemobile)

【如何均衡媒体饮食】每天平均12小时媒体摄入量:尽可能多的从书籍等摄取提升自己的养分;3小时阅读好的报纸陶冶性情;2小时看剧打游戏;1小时处理邮件等人际关系;半小时处理刷社交媒体;避免虚假内容 https://wanqu.co/p/6307

推荐一本开源电子书《图说 Hadoop》,介绍最流行的大数据管理工具 Hadoop,面向新手,使用卡通图画介绍入门的基本概念。原文是英文,但非常浅显,很好懂。http://hadoopilluminated.com/

大连理工大学出版社下载中心,可以下载到他们出版的各种教材的相关课件、音视频等资料,不管有没有买过书:http://dutp.dlut.edu.cn/xgxz1/MP3ykjxzzx.htm

《默克诊疗手册》,在美加以外地区称为《默沙东诊疗手册》,是世界上使用最广泛的医学信息资源之一。 本手册致力于到 2020 年向各大洲高达 30 亿卫生保健专业人员和病人提供当前最佳的医学信息。https://www.msdmanuals.cn

一个超酷的网站!!!!! http://stars.chromeexperiments.com/ 刚进去看到loading the galaxy我心就开始怦怦跳了!!! 真的要看啊超酷超酷!

由于中国政府并未公布工人罢工和抗争的官方统计数字,中国劳工通讯的工人集体行动地图 @bagongditu 是公众唯一能够查阅的数据库。自2011年起,地图以中英双语收录了近10000宗工人集体行动的详细资料 http://maps.clb.org.hk/strikes/zh-cn

居然有人真的做出了博尔赫斯笔下的《通天塔图书馆》,可以搜索、也可以一页一页看。 https://libraryofbabel.info/

Yale大学有个很有趣的地理经济学(GEcon)的数据库:http://gecon.yale.edu ,展示了一个国家每个地区经济水平分布图。可以看到,每一个国家的GDP基本都是集中在几个大城市(都市圈)。如果再和推特的话唠城市做一个对比,估计可以得到一些很有趣的结论~

又发现一个杀时间网站:http://brainden.com/ ,包含各种有趣的英文谜语,逻辑题,智力游戏,脑筋急转弯等。

上海图书馆新发布的家谱知识服务平台“华人家谱总目”(http://jp.library.sh.cn/ ),提供基于人、地、时、事、堂号多维分面浏览检索家谱信息,并以可交互时间轴、地图展示某姓氏在某一地理空间分布情况。该家谱知识库的元数据也以关联数据形式开放,提供API接口。

学术界海盗湾Sci-Hub,2011年哈萨克斯坦女大学生 Alexandra Elbakyan 所建,旨在去除所有学术障碍,免费提供4千7百万论文获取,去年被Elsevier起诉,网站关了开,开了关,一度移入暗网。现在的域名是:http://sci-hub.io/

美国英语与英国英语的词汇差异 http://themindcircle.com/british-vs-american-english-differences/

很赞的网站:Wireless Philosophy,简称 Wi-Phi ,一个开放的哲学网站,致力于以轻松有趣的动画形式阐释哲学问题及哲学思维方式。建于2013年,现在已经有105个哲学动画上线了。 http://www.wi-phi.com/

GPlates Portal 首次发布了可交互的3D数字化世界海底地图:http://portal.gplates.org/#SEAFLOOR 。赞。由悉尼大学的一个研究团队制作。

密码安全|《隐身的艺术》第一章摘要

THe Art of the Invisibility: the world's most famous hacker teaches you how to be safe in the age of big brother and big data

The Art of the Invisibility: the world’s most famous hacker teaches you how to be safe in the age of big brother and big data

(从英文版出版社得知,这本书的中译本将由湛卢文化出版,期待!)

延伸阅读文章:


密码

我们使用密码存在的安全问题是:

  • 密码字符过短;

  • 相同密码在不同账户重复使用;

  • 密码中含有账户名/个人真实属性信息。

对应的策略有 5 点,具体的介绍在下面:

  • 增加密码字符长度。

  • 使用密码管理器(例如 1Password、LastPass)给使用的每个网站设置随机、唯一的密码。

  • 尽可能的启用双重身份验证(2FA),二次验证登录者身份。通常是通过手机短信、邮件、Authentication App 获取随机验证码。在网站 https://turnon2fa.com 可以查看到如何启用 2FA.

  • 给密码管理器设置一个安全、容易记住的管理密码,并打开 2FA, 保存好备份代码。

  • 复杂规则密码的更好替代方法是不使用已经被破坏泄漏的密码。

EPPB(Elcomsoft Phone Password Breaker)的目的是使执法机构、政府机构获取 iCloud 账户的软件,并且可以公开销售。

为了保护你的 iCloud 和其它在线账户,必须设置一个强密码。

除了工作相关的密码之外,还有那些可以保护大部分个人账户的密码。选择一个难以猜测出来的密码,并不能避免 oclHashcat 这类黑客工具可能攻破你的密码,但是它可以使破译过程变慢,使得攻击者转向更容易的目标。

我们可以合理猜想,在 2015 年 7 月的 Ashley Madison 黑客事件中,暴露出来的一些密码肯定正在被用于其它地方,包括银行账户、甚至工作电脑。在公布在网上的 110,000,00 个 Ashley Madison 密码中,最常见的是「123456」「12345」「password」「DEFAULT」「123456789」「qwerty」「12345678」「abc123」「1234567」。如果你看见你自己的密码有上述这些,你很可能容易受到数据破坏。

Pwned 安全检查

邮箱账户

可以在网站 https://www.haveibeenpwned.com 检查你的邮箱账户信息是否出现过泄漏。

Selection_005

邮箱账户没有发生过泄漏

Selection_007

邮箱账户在 3 个网站发生过泄漏

Selection_008

邮箱账户发生泄漏的详细说明

密码暴露

https://haveibeenpwned.com/Passwords 可以检查密码是否已经在数据泄漏中暴露,如果显示红色背景的以下信息,说明查询的密码已经不能再使用了。

Selection_002

如果显示结果是 Good news–no pwnage found!,也只是表示这个密码在密码泄漏库中没有,但并不表示它是强密码。

Selection_003

在延伸阅读《开发者如何错误地使用密码》文章中提到了 Troy Hunt, 他是澳大利亚微软区域总监兼微软开发者安全专家。从 2011 年开始参与微软社区里的网络安全问题。他参与的重要项目之一就是 Have I been pwned,这是一项免费服务,收集了数据泄漏,帮助网民确认他们是否受到了网络恶意行为的影响。

在 21 世纪,我们可以做得更好,也就是用字母和数字组合的更长、更复杂的密码。以下是自动、手动两种作法。

自动管理密码:使用密码管理器

最简单的方式是放弃创建你自己的密码,使用简单的自动化生成。有若干数字密码管理工具。它们不仅可以把密码存储在一个加密的金库里,当你需要密码的时候也允许一键获取,密码管理工具还可以为每个网站生成新的强、独特的密码。

使用密码管理器会有两个问题。

  • 其一,密码管理器使用一个管理员密码来获得其它密码。如果有人碰巧使用恶意软件感染了你的电脑,当恶意软件记录每次按键输入,会盗取密码数据和管理员密码。这下就完蛋了!黑客会利用密码管理软件的后门获取密码。

  • 其二,如果你丢失了管理员密码,意味着你丢了所有密码。最终,即使你可以重置每个密码,但如果有大量账户,这将会是一个很大的工作量。

尽管存在这些缺点,但下列小技巧应该足够保证密码安全。

  1. 强密码口令(短语),而不是密码,应该足够长,至少 20-25 字符。 随机字符的作用最好,但人类大脑难以记住随机序列。所以需要使用一个密码管理工具。推荐使用开源的密码管理工具,只在你的电脑本地存储数据,例如 Password Safe、KeePass.

  2. 对两个不同的帐号,从不使用相同的密码。 密码管理工具可以生成和存储强而唯一的密码。

在延伸阅读中提到,从 20 世纪 70 年代开始考虑安全存储密码,经过了使用哈希处理、BCrypt 算法处理密码,算法处理已经来不及抵挡强制破解密码,再加上很多网站还没有限制连续重复登录请求、使用验证码的情况下,要求用户在设置密码的时候遵守「至少只用数字、标点符号」这类复杂规则,并没有帮助解决密码重复使用、密码弱、将个人信息输入密码的问题

手动创建并写下密码

  1. 用纸写下密码,不要直接把账户、密码全部写出来,例如:中国银行:3sto7ghendp1vbs*.
  2. 用隐晦的词汇代替账户,密码只写一部分

密码保护之外的设备保护

不要轻易随便与别人共享帐号密码。

除了密码保护在线服务,也应该用密码保护个人设备(电脑、手机、平板等),需要设置一个开机密码或者屏保密码。

三种常见的给手机(Android/iOS/其它类型)加锁方法

  1. passcode:最常见的一种方式,以特别的顺序输入的一连串数字

    1. 不要用手机号码里的数字设置
    2. 有些设备也支持 text-based passcode , 字母与数字混合
  2. 另一种是 visual
    Android:Android lock patterns:140704 种组合
    alps

  3. 第三种:biometrics 指纹解锁,人脸识别

建议 Biometrics 和 passcode 结合使用。

E-Learning 3.0 MOOC 之 图表

第三课 Graph 链接:https://el30.mooc.ca/cgi-bin/page.cgi?module=7

课程概要

图表(Graph)是 web3 网络的概念性基础,这个概念对于研究「连接主义」(Connectivism)的人来说很熟悉,因为连接主义的观点是知识由网络中节点的关系组成,换句话说,知识是一种图表(不是讲述一连串事实和结构)。

图表,尤其动态图表有特别的属性,其结果可以在社交网络理论、现代人工智能、经济和政治理论中找到。

以前在互联网上,有关图表的工作与图表的语义有关。例如我们说像语义网(semantic web)和信任网络(Web of Trust, WOT)的发展。这些都是有限的成功。在 web3 中,节点之间的连接(「边」)是使用密码学创建的,因此创建了具有不腐败连接(incorruptible connections)的链或者树。

about Semantic web :
https://www.w3.org/standards/semanticweb/

https://zh.wikipedia.org/wiki/语义网

其中一个例子是梅克尔树(Merkle Tree),树枝包含叶子的哈希,树干包含树枝的哈希。图表——例如有向无环图(Directed Acyclic Graph) 可以这种方式创建。

我们可以使用这些技术已经建立的的数据结构,创建一种新型内容。一个著名的例子是比特币,它基于块环链的交易记录,本质上是一个已有链。另一个例子是存储在 GitHub 上的软件更新版本的集合,GitHub 使用 DAGs 管理版本控制和软件复制。归属网络、概念网络、网站,所有这些都可以用图表来表示。

在连接主义中,我们探讨过将知识视为图、将学习视为图表的增长和操作的思想。它帮助学习者理解每个想法与另一个的关系,重要的不是个人观点,而是整个图表如何增长和发展。

它帮助我们理解图表——甚至知识——不仅是一个表象系统,还是一个感知系统,图表不仅是仓库,还是一个由周围环境塑造的增长型、动态实体。

图表和图表理论以一种具体的方式展示每个事物如何依靠其它事物,并且帮助我们把对自己的理解、知识、工作放在一个更广阔的背景下。哈希图通过列举克隆、仿造、版本控制、合并,进一步说明了基本的知识创造机制。


Ben Werdmuller 认为区块链技术并不是完全匿名,可以从元数据(metadata)分析出发布信息、交易双方的身份,包括应用在安全聊天软件中,它只是让推断分析真实身份更加难。metada makes something open.

Indieweb:用户应该能够从您自己的网站分享,讨论和发布,最好是从您自己的域名中分享,不受任何单一公司的负面控制,现在大多数对话和大部分话语都是发生在网络上以及由极少数非常富有的公司如Facebook,Twitter和Linkedln所拥有的空间中。

Unlock:直接连接读者与作者。

使用 Facebook 時,應該考慮什么?

原文:https://veekaybee.github.io/2017/02/01/facebook-is-collecting-this/

winnower.jpg
Courbet, The Winnowers

摘要:Facebook 通過眾多渠道使用數百種方法收集有關你的數據。你很難退出,但通過了解他們收集的內容,可以認識到 Facebook 平台的危險性,并選擇以更嚴格的限制來使用 Facebook.

目錄:

Facebook 無論好壞,已經成為我們的網絡客廳、第三空間。這是我們與好友交談、發布新聞、組織活動、悼念逝者、慶祝嬰兒出生、訂婚、找新工作、展示新發型和假期的地方。

Facebook 平台已經占據了如此大的占有率,并且開始作為我們的冥想盆。因此,了解 Facebook 公司獲取使用我們的希望、夢想、政治宣言、嬰兒照片信息做什么尤為重要。

從獲取數據開始。2014年,Facebook 工程師寫到他們每天可以獲取大約 600TB 的數據

對比一下,《戰爭與和平》的文本大小是3.1MB;1966年的蘇聯版《戰爭與和平》電影時長7小時,大小是8GB

因此,人們每天上傳的數據總量相當於1.93億本《戰爭與和平》書籍、75,000部《戰爭與和平》電影。

Facebook 數據政策 概述了它收集的內容和如何處理數據。然而,和大多數公司一樣,Facebook 忽視了實際要點,沒有告訴用戶到底發生會什么。

我揣測自己寫每條狀態更新時的按鍵,使我感到沮喪,對此決定做一些研究。以下所有信息來自科技商業新聞報導、學朮出版物、我作為 Facebook 用戶能夠在客戶端看到的內容。作為一名從事用戶數據工作10年以上的專家,我在這篇文章中加入了自己的詮釋。

如果任何一位 Facebook 員工想要對此篇文章進行糾正,我會很樂意聽他們說并沒有像下文所說的那樣收集和處理用戶數據。

Facebook 如何收集數據

為了理解 Facebook 數據收集的工作原理,我繪制了一個(非常非常)簡單的圖表。用戶將數據輸入用戶界面(應用程序),這是前端。

這些數據隨后被收集到 Facebook 的數據庫(這些數據庫有很多),這是后台。

用戶在前端看到的數據是后台數據的子集。

facebookui.png

如果你對更多的技朮規格感興趣,Google 上面有很多架搆圖。Facebook 正處在處理大數據的前沿,它們的堆棧包括 Hive, Hadoop, HBase, BigPipe, MySQL, Memcached, Thrift 更多。所有這些都存放在許多大型數據中心,比如 Prineville Oregon 數據中心。

在發帖之前,Facebook 知道什么?

在點擊”post”之前,Facebook 可能就開始收集數據了。當你編輯信息時,Facebook 開始收集你的按鍵內容

Facebook 曾經使用這些數據來研究自我審查(研究報告 PDF)。

prepost.png

研究員寫道:

我們報告的結果來自一份探索性分析,檢查 Facebook 「最后時刻」的自我審查,或者在寫完后在 Facebook 被過濾的內容。我們在 17 天內收集了 390萬名用戶的數據,并將自我審查行為與用戶描述、用戶社交圖表以及他們之間的互動特徵聯系起來。

這意味着,如果你發布了類似於「我只是討厭我的老板,他把我逼瘋了。」這樣的內容。雖然在最后一刻刪除了這句話,改寫為「伙計,現在的工作真是太瘋狂了」,Facebook 仍然知道你在刪除之前輸入的內容。

以下是他們用於研究的數據點:

prethought.png

這里值得注意的是:就像不能確保未發布的內容不會被存儲;用戶刪除帖子、評論和簽到,不能確保數據真的被刪除了。

因此,即使刪除了帖子,Facebook 仍記錄了它。Facebook 記錄元數據,或記錄有關你的數據的數據。比如,撥打電話的數據就是實際談話內容,它的元數據是撥打電話的時間、地點和時長等信息。

對於 Facebook 來說,元數據和真實數據同等重要,它使用元數據推斷你的身份。在 Chrome 瀏覽器使用開發者工具,可以相對容易地看到大量數據通過 xhr 從你的客戶端傳送到 Facebook 后端。我不是一個前端忍者(但實際上我很樂意和其中一位談話,看看我們還能做些什么),但從一張圖上,可以看到 Facebook 在追蹤用戶做某件事花費的時間嗎?具體內容不確定,但它可能計算出了耗費在 Facebook 網站的時間。Facebook 報道說

xhr-fb.png

順便說一句,對於賬戶刪除也是如此。

由於 Facebook 擁有如此多的系統和可以數據共混的地方,正如一位 Facebook 前顧問所寫:

回答你提問的第一部分,「你可以付錢讓 Facebook 徹底刪除你的所有信息嗎?」假設「徹底」意味着完全清除你留在 Facebook 的任何痕跡。答案是不會。

同樣,如果刪除帖子,并不能確保 Facebook 不會在后台數據庫保存這個帖子,它只是不會顯示在客戶端頁面。

只要你真的寫了帖子、上傳了圖片,或是修改了任何信息,對於 Facebook 內部研究使用、轉售給 Acxiom 這樣的營銷聚合商、通過國家安全局這樣的機搆和 NSA 的稜鏡計划提供給美國政府,這一切都是絕對公平的游戲。

發帖之后:Facebook 收集關於你的什么數據

很顯然,Facebook 收集你自願提供給它們的所有數據:政治派別、工作地點、最喜歡的電影、最愛讀的書、打卡簽到的位置、評論、對帖子的任何所有反應。Facebook 允許你下載他們的數據庫中關於你的數據子集

在我個人的數據子集中,我可以看到:

  • 我上傳的照片、標記了我的照片
  • 視頻
  • 我曾經發布在自己時間線上的一切內容(包括我表示感興趣的事情、人們發布在我的時間軸上的內容、共享的記憶)
  • 好友、添加我為他們的好友
  • 我的所有私人信息
  • 我參加過的活動
  • 我登錄過的每一台設備

以及,我可能感興趣的廣告。這不是我自己寫的東西,而是 Facebook 基於我發布的每條內容,利用算法生成的。

我們將會在廣告部分討論這個問題。

除了數據和元數據,Facebook 也跟蹤用戶的意圖。上面已經探討了其中一種跟蹤方式:未發布的信息,另一種則是在視頻中的熱圖跟蹤

Facebook不僅知道關於你的一切信息,也了解你的朋友關系。一言以蔽之,Facebook 很了解你,盡管你沒有完整填寫你的個人資料、也沒有主動發布到網站。

Facebook 內部用你的數據做了什么?

Facebook 利用收集到的數據做了很多事情。

首先,Facebook 對信息進行簡單查詢用於提高網站性能或用於行業報告(例如,網站運行時間,Facebook 用戶數量,今天的廣告收入是多少?)。這對於任何公司都是如此。

不過,對於 Facebook 來說有所轉變。Facebook 有一個完整的工程團隊致力於搭建工具,使得數據更易於用 SQL——類似基於 Hadoop 和 Hive 的語言——查詢。盡管 Facebook 聲稱嚴格控制權限,有些用戶卻并不這么認為

唱片公司 Anjunabeats 主管 Paavo Siljamäki 在 Facebook 發帖提醒人們注意這個問題,訪問該公司洛杉磯辦事處時,可以很容易訪問他的 Facebook 賬戶而無需他的密碼。

這里是 Facebook 員工訪問私人數據的賬戶的更多說明

其次,Facebook 把用戶作為實驗對象進行學朮研究。在數據政策中沒有提到這一點,這很有意思, Facebook Research 主頁的標題寫着:「在 Facebook, 研究滲透到我們所做的一切。」

Facebook 有一個相當大的數據科學團隊(最新統計是 41 人)。我想說的是,一個擁有 15000 人同樣規模的公司,如果它真的想要積極推動一個數據科學研究項目,可能只有 5 個數據科學家。

然而,直到 2014 年為止,還沒有任何程序可以檢查被訪問的數據類型、以及進行怎樣的研究。正如一位前 Facebook 數據科學家寫到

我在 Facebook 的時候,沒有一個機搆審查委員會來審查為內部目的進行實驗的決定。一旦有人得出結論,他們決定要把這篇文章發表到雜志上,那么在可發表的內容上,確實存在反反復復的公共關系和法律問題。如果你想做一個實驗,看看人們會點擊綠色按鈕還是藍色按鈕,你無需得到批准。同樣,如果要測試新的廣告定位系統,以查看用戶是否點擊了更多廣告,是否收入增加,無需獲得機搆批准。

雖然他接着指出這在大多數以軟件服務的公司中是正常的,但大多數 SaaS 公司在過去十多年中也沒有精心收集人們生活中最私密的細節。

他繼續說道:

大多數人在 Facebook 研究數據的基本目的是影響和改變人們的情緒和行為。他們一直在做這件事,讓你更喜歡故事,點擊更多的廣告,花費更多時間在 Facebook 網站。

盡管這是大多數網站的目標,但每天花費超過 40 分鐘 在企圖在情感上削弱你的網站上,你可能需要三思而后行。

Facebook 除了挖掘文本內容、研究我們的情緒,它還會操縱它們

新聞 Feed 是操作的首選。特別是因為 Facebook 已經設計出盡可能吸引人的功能:它是我們神經系統的突觸糖。Facebook 希望確保你盡可能在 Feed 多花時間,并為此花更多時間來處理嬰兒照片和其它快樂的事情,以及那些引發爭議和憤怒的新聞。而像「我今天吃過早餐」這樣的正常狀態不會引起任何反應。

這就是當今所謂過濾氣泡是怎樣興起的。因為人們會點一些他們感興趣的東西,所以 Facebook 就只呈現吸引用戶的內容,這意味着其他觀點、朋友和圖片會從一個人的 Facebook Feed 中刪除。如果想了解這種方式是如何工作的,可以參考 Red Feed、Blue Feed, 展示了自由與保守的 Facebook Feed 的不同之處。

他們還在研究其它什么?首先是同性戀出櫃比例。Facebook 如何知道這些的?「在過去的一年里,大約有 80 萬美國人更新他們的個人資料,表達同性吸引或專屬性別」。

大量的 Facebook 研究都是關於圖論,也就是我們和朋友間的關系圖。換句話說,它正在對從未同意的學科進行人類學研究。

例如在近期,數據科學小組發表了一項關於美國移民社區的社會關系的研究。在報告中,研究員使用了以下數據:

我們將我們的分析限制在基於已經被確認的社交網絡數據基礎上的綜合判斷,這些人在分析前 30 天內至少使用過一次 Facebook. 我們使用個人資料中指定的家鄉來確定用戶的國籍。

此外,我們也把分析限制在目前至少有2個朋友居住在本國的人和目前居中在美國的另外 2 個朋友。我們的結果基於超過 1000 萬滿足這些標准的人的樣本。整篇報告中,所有關於 Facebook 用戶的引用都毋庸置疑地暗示了這些限制。

這些是我們知道的公開研究,他們還在做哪些非公開的研究?

Facebook 理所當然喜歡研究的另一個內容是人臉。每次你在照片中標記自己時,Facebook 會認出你,并且做相應調整。

Facebook 鼓勵用戶在他們個人帖子中上傳的照片中「標記」人,社交網絡將收集到的信息儲存起來。Facebook 使用一個叫作 DeepFace 的程序來匹配用戶的其它照片。

selfie.png

這個名為 DeepFace 的程序是獲取更多准確標簽的絕佳方式。它也是侵犯個人隱私的絕佳手段。比如,倘若你不想被標記該怎么辦?假如你在政府抗議活動中?或者簡單來說,如果你和一位朋友去聽音樂會,不是和另一位朋友,卻還不想讓對方知道,該怎么辦?

不幸的是,很快就沒有隱私可言了。Facebook 正致力於識別照片中人的身份。Facebook 上關於 DeepFace 的論文指出,「人臉識別技朮對社會和文化影響是深遠的」,然而根本沒有談到人臉被標記的可能的隱私危險。比如

她說,『我們很快就會在商店里安裝攝像頭,以識別顧客的購物情況』。

他們怎么知道這些的?

因為這些數據是我們自願提供的。每次更新狀態、上傳照片并做標記、給朋友發信息、在一個地方簽到、登錄 Facebook, 系統都會自動生成一條信息保存到數據庫中——「嘿,這個人現在在Facebook 世界里。」,包括了 WhatsappInstagram 兩個應用。

影子檔案

如果你不願意分享那么多數據,Facebook 會怎么做?它創建了影子檔案或是「Facebook 收集的有關你沒有提供的數據集」。

正如這篇文章所述:

盡管你從未提供它們,但 Facebook 很有可能獲取了你的備用郵箱地址、電話號碼、家庭地址。所有這些都是由嘗試尋找并聯系你的朋友提供的。

更糟糕的是,Facebook 主要收集你的面部信息。

最近的一起訴訟不是針對郵箱地址和電話號碼,而是「人臉模板」:每當用戶上傳照片時,Facebook 會掃描所有人臉并創建「數字生物識別模板」。

即使 Facebook 只是為自己收集數據,所有這一切也是有關系的。但還有一些外部供應商。

Facebook 和營銷人員是什么關系?

Facebook 的數據政策指出,它和其它供應商合作收集關於你的數據:

我們會從第三方合作伙伴收到有關你和你的 Facebook 在線與離線的活動信息。例如,當我們聯合提供服務時,來自合作伙伴的信息,或從廣告商那里獲得關於你的經曆、與他們互動的信息。

Facebook 收集了「大約 29,000 個人口統計指標,其中 98% 基於用戶在 Facebook 的活動」。

與此同時,據報道大約有 600 個數據點來自 Experian,Acxiom等獨立數據代理商,用戶無法訪問從第三方獲得的人口統計數據。

除了收集你自願提供的所有詳細信息,比如姓名全稱、出生日期、興趣愛好、宗教信仰、以及所有你上過學和工作過的地方,Facebook 還會對它不知道的事情作出假設,這樣就可以與 Acxiom 、其它廣告代理商分享數據,以便更有效地把你作為目標。

比如,Facebook 使用家庭收入創建數據檔案賣給營銷商,他們畢竟是 Facebook 的付費客戶。然后,營銷人員可以購買細分資料,包括以下任何一種

地理位置、年齡、世代、性別、語言、教育水平、研究領域、學校、族裔關系、收入和淨資產、房屋所有權和類型、房屋價值、財產大小、房屋面積、建造年份、家庭組成。

Facebook 如何知道這些的?根據它所知道的和從 Experian 等處獲取的數據,對你作出一些假設

這類數據隨后可以用來以廣告的形式定位 Facebook 用戶。在 Facebook 做的這種定位告訴你很多關於他們隱藏在幕后的數據。例如,不僅可以通過位置/年齡/性別/語言,還能通過興趣愛好和不同生活階段(如剛剛訂婚、6個月前訂婚、早期學齡兒童)定位目標。如此過細地定位一個人是有可能的,而且還能達到一定數量(在我的例子中是 100-200 人)。

targeted.png

這些數據會被轉賣到下游,通過信用卡和其它營銷資源,與其它既存的關於你的數據混合在一起,從而創建類似這樣的網站,試圖建立你的完整個人資料。沒有簡單的方式來擺脫它,因為一旦創建了數據,刪除它難上加難了。這就是為什么隱私活動人士最關心的問題之一是讓公司每隔一段時間刪除大量數據。

Facebook 也有權在廣告里使用你和未滿18歲孩子的照片

Facebook 給政府提供什么數據?

我們并不了解 Facebook 提供給政府的所有信息。Facebook 有一個政府報告頁面,該頁面自 2016 年6月以來沒有更新過。但我們知道政府還在要求獲取越來越多的信息

這些數據成為一份報告,報告顯示了數據訪問量和受影響的用戶量,但沒有提到任何關於所提供信息的類型、訪問數據的機搆類型(當地政府、州、聯邦調查局/國家安全局)。

國家 用戶數據要求總量 參考的用戶賬戶總數 產生某些數據請求的百分比 內容限制 保存要求 保留的用戶/帳號
美國 23,854 38,951 80.65% 0 31893 56714

馬克·扎克伯格(Mark Zuckerberg)甚至發表聲明

Facebook 過去不是,現在也從來沒有參與任何讓美國或任何其它政府直接訪問我們服務器的計划。我們從來沒有收到任何政府機搆的一般要求或法院命令,提供大量信息或元數據的,據說 Verizon 收到過這樣的要求。如果我們這樣做了,會積極與之抗爭。在昨天之前,我們甚至沒聽說過稜鏡計划。

在這里,重要的是從字里行間讀出的含義。直接訪問服務器不是發送大容量文件的必要條件,也沒有必要以此名了解稜鏡計划

也很難知道國家安全局是否以其它方式從 Facebook 收集數據。至少在歐洲,有關此問題的訴訟正在進行中

但就目前而言,僅僅假設這種監控正在進行

退出 Facebook 后,Facebook 會跟蹤什么?

在 Facebook 網站之外,Facebook 通過單點登錄跟蹤用戶。

如果你退出,Facebook 也會通過 cookies 跟蹤你。正如它們的隱私政策所述

當你訪問或使用第三方網站和應用了我們服務的程序時,我們會收集信息。收集的信息包括訪問的網站和應用程序、在這些網站和應用上使用我們的服務、以及網站或應用的開發者或發布者提供給你或我們的信息。

Facebook 也在試圖跟蹤或已經在跟蹤你的光標在屏幕上的移動情況

早在 2011 年,如果你仍然登錄着 Facebook, 它就開始跟蹤你如何在網絡上移動

未經你同意,Facebook 會記錄你登錄后所在網頁的位置。Nik Cubrilovic 深入挖掘了一下,發現即使登出 Facebook 仍會跟蹤你的位置。Facebook 否定了這一說法。

可以肯定的是,Facebook 收集你的瀏覽曆史來丰富廣告。

當我使用 Facebook 時應該考慮什么?

這一切意味着什么?從本質上講,它意味着你在 Facebook 上做的每件事情,或是通過其它網站登錄,都可能會被 Facebook 偷偷地跟蹤并保留在服務器上。

需要明確的是,很多公司目前都會對用戶進行某種形式的跟蹤。除此以外,沒有其它方式可以衡量經營活動。但是 Facebook 顯然在一段時間內躡手躡腳地走出了道德上可接受的數據業務實踐的范圍。盡管 Facebook 目前沒有做我提及的一些事情(抓取預發布內容、擾亂新聞訂閱源),但它們也在做着非常相似的工作,而且沒有隱私保障和,也不保證不用於實驗。這也意味着即使你在 Facebook 并不活躍,仍會被跟蹤。

每個像你這樣的人發的帖子、添加的每個好友、簽到的每個地方、點擊的每個產品類別、每張照片,都會保存在 Facebook 并被聚合在一起。

如何聚合?很難描述。可能是社會實驗的一部分,也許你的信息正被提交給政府部門;也許Facebook 的那些沒有必要擁有此權限的員工可以訪問你的頁面、查看你的工作經曆;也許相同的就業信息正被發送給保險公司。

這包括了所有的私人小組、封閉小組以及所有的消息。正如 Facebook 指出的,在 Facebook 不存在隱私這回事。

實質上,你需要加入 Facebook, 這意味着接受你做的每件事情都會被公開,或是被用於廣告、政府機搆分析。

如果不想讓 Facebook 獲取我的數據,應該怎么辦?

Facebook 開始是大學生互相聯系的一種方式,最終達到了改變人們行為、跟蹤用戶使用情況,并且可能為政府整合信息的程度。

問題在於無論誰是否使用 Facebook, 都牽涉到 Facebook 的跟蹤、關系標簽、影子檔案系統。如果你是 Facebook 活躍用戶,尤其如此。

因此,最重要的事情是意識到這種情況正在發生,并盡可能少給 Facebook 提供數據。

下列是我為了盡量減少在 Facebook 的曝光而做的事情。

并非每個人都會像我這樣做。但最重要的是,即使你決定繼續使用 Facebook , 也要知道Facebook 在使用你的數據做什么,并且有權在社交中作出權衡。

  1. 不要發布過多的個人信息。
  2. 不要發布你孩子的任何照片,特別是當他們處在無法同意的年齡。
  3. 當你用瀏覽器訪問 Facebook 后, 退出 Facebook. 使用一個單獨的瀏覽器訪問 Facebook, 其它事情則用另一個單獨的瀏覽器。
  4. 使用廣告攔截插件。
  5. 組織或參與政治活動,不要使用 Facebook , 尤其是 Messenger 應用。如果你需要組織活動,用 Facebook 作為發起端,然后換用別的平台。推荐平台:Signal 是目前私密聊天的典范。Whatsapp 的群組聊天是可以的,但我不推荐它,因為它與 Facebook 的元數據系統緊密相聯。電報(Telegram)也不錯,但還不夠好,因為它不是開源應用。此外,它取決於你的風險等級。這是有關這些平台更多信息。
  6. 不要在手機上安裝 Facebook 應用程序,它會請求許多不合理的權限
  7. 不要在手機上安裝 Messenger 應用。使用移動端網站。目前,Messenger 應用在移動設備上被屏蔽,可以在瀏覽器啟用桌面版

很遺憾,做得如此好的社交網絡在互聯網上也是最糟糕的。但是,在人們遠離這個平台或對它施加某種經濟壓力之前,任何都不會改變。

就我個人而言,作為一個數據專家,我個人所做的事情就是給發郵件給我的 Facebook 招聘人員發送以下信息:

親愛的招聘專員:

Facebook 收集、使用數據的方式,包括:

這讓我不僅強烈反對在 Facebook 工作,而且使我有力地評估了自己使用 Facebook. 因為我從來不知道輸入這個系統的每個字符將如何被使用。

如果 Facebook 公司承諾要改變發展方向,并且

  • 利用數據來解決這些問題
  • 積極研究如何刪除不必要的數據
  • 積極研究非政府干預的私人安全通訊
  • 并積極研究如何避免私人客戶數據被共享給不必要的第三方

我很想知道。

謹啟

Vicki

我們是社會性動物,我們想要連接、得到認可、分享、在其他人所在的平台上組織活動。目前而言,這是 Facebook 的優勢。此外,很難說 Facebook 完全是壞的:它的確把人們聯系起來,幫助組織聚會和活動,并且確實使世界更加互聯互通。

但是,作為 Facebook 用戶,我們和我們的數據是它的產品。而且,隨着我們對這些數據的使用方式了解更多,我們仍然可以按照它的規則使用 Facebook,但要對它有所了解。

這里是黑客新聞討論區。

E-learning 3.0 核心概念之「数据」

第一节课介绍了 web 1.0, web 2.0, web 3.0 的特点,也是不同阶段互联网技术发展的主流应用。

这是 E-Learning 3.0 MOOC 第二节课程。从本节开始将依次讲解 Web 3.0 同时也是 E-Learning 3.0 涉及的 9 个核心概念。

本节课程页面在这里,Stehen Downes 和 Shelly Blake-Plock(Yet Analytics 创始人)对谈:https://www.youtube.com/watch?v=dsmdwnUwKkA


这节课的信息量非常大,第一次听说 SCROM、xAPI、LMS、LRS 这些概念,需要从对数据演变过程和去中心化入手。

在线内容:从文件到数据

正如 Stephen Downes 在数据这节课的文章 https://el30.mooc.ca/cgi-bin/page.cgi?post=68416 里所说,web 1.0 时代基于客户端-服务器模式,以文件和网页为主,在线学习的内容呈现形式也是如此,它们之间没有很好的交互、呈现标准也会不统一,而且 DVD 这类资源存放在用户端,没办法不同多终端使用。web 2.0 出现了基于数据和平台互操作性的网络。web 3.0 时代则将平台作用削弱,直接是终端之间直接交互,也就是分布式网络,也就是 e-learning 3.0.

在这个过程中,我们对内容的理解从普遍的(现在依旧还在用的)word/pdf/excel/video 等形式文档,随着对内容交互、分布式、共享互相链接的增加,转变扩展到对关于内容、使用者(学习者)的更多元数据的获取和分析。

When we created a learning resource, we created data about that resource, and this contained fields like ‘title’ and ‘typical age range’. From there it is a very small step to putting our content into the database as well, and completely converting our document into data. Most web-based content today comes from some sort of database.

例如,创建一份在线数据表单来收集统计一些必要的信息。在这份表单制作中设置的字段和填表对象填写的信息都是数据。现在很多在线表单平台都会提供简单的数据统计分类。

再比如,Facebook、Google 都会收集有关用户的一切信息,作为分析的 metadata, 在文章「使用 Facebook 时,应该考虑什么?」中,作者 Vicki Boykis 说明了 Facebook 获取用户数据之多,以及如何利用这些数据获利。

The dependence on centralized sources for linked data has led to the rise of platforms like Facebook and Twitter, with the result that people no longer feel in control of their own data, and even worse, have difficulty accessing and sharing this data. Also, it has become increasingly difficult to read this data without being tracked and without being forced to view advertisements and unwelcome messages.

数据:从中心化到 去中心化

关键词:去中心化linked data

如 Yet Analytics 创始人 Shelly Blake-Plock 所说「data goverance can be used for good or evil」(https://www.lauraritchie.com/2018/10/25/el30-notes-week-1/)。我们也可以看到、已经深刻体会到网络上个人隐私安全问题,即使在单纯的在线学习过程中,也需要考虑这一点。去中心化则是一种新的选择。

除了这一点,更重要的是因为众多数据资源需要直接被获取、便捷共享、互相链接、在不同终端随时随地使用,每个人都可以管理控制自己的数据。

在 web 2.0 时代,我们把来自不同来源的数据堆积放在同一个网页上,这些都是在网页平台的幕后操作的。浏览器仍然需要从单一的网页上收到内容来呈现和组合。如果我们可以直接获取源数据库,根据自己的需要来选择、组合数据。

From the perspective of the browser, everything is pretty much the same. It doesn’t matter whether a web page was created from one data source or a dozen. The browser still had to visit a web page and still received content from that single source to assemble and display to the viewer.

web 3.0 是一个去中心化链接数据的时代。每个人都可以管理自己的数据,随时随地存储并使用。像 SolidIndieWeb 项目就正在寻找方法,使用户可以创建和管理自己的数据。

学习者个人如何管理数据

Stephen Downes 与 Shelly Blake-Plock 对谈中谈到的用于记录、存储、分析学习进度的技术 SCORM、xAPI、LRS 等等,暂时还不想深入了解这些。昨天翻了中文圈的「教育大数据国际联盟」网站,里面有一些关于 xAPI 的介绍。目前对我来说有些深奥,还用不到它们。

Learning also becomes a process of being able to comprehend data, to be able to look at representations of data though dashboards and visualizations, and to be able to identify patterns and draw conclusions. It’s interactive, immersive and engaging, a process of learning how to perceive and comprehend rather than to decode and store.

学习也成为能够理解数据、通过仪表盘和可视化来观察数据表现,并能识别模式、得出结论。它是一个互动式、沉浸式、吸引人的过程,是一个学习如何感知(perceive)、理解(comprehend)的过程,而不是简单的解码和存储。

作为一个自主学习者,在不想将这些数据交由互联网公司获取管理的情况下,个人如何管理自己的学习资源和进度?很高兴看到「eLearning 3.0: How do I show my expertise?」 这篇思考文章。作者提出了很多问题,认为一个人记录更新自己的学习过程,取决于具体的情况(it depends)。

学习 E-Learning 3.0 MOOC

-1. 关联主义与学习

关联主义(Connectivism) 基于这样一种观点,即知识的本质是网络中联结的集合。因此,学习就是创造和塑造这些网络的过程。

关联主义课程的重点是发展两种类型的知识:个人知识(personal knowledge)、由活动和经验形成的想法和信念网络;另一种是社会知识,通过交流和互动形成的人与制度的公共网络。

MOOC 环境是为了支持这两种类型的学习。MOOC 没有一节单一的课堂或学习管理系统;相反,该课程本身是为个人网站或博客之间创建关联,并通过这个网络创建不间断的交流与合作。理想情况下,课程参与者会有管理个人知识网络的工具和方式,通过社交网络进行互动。

课程内容包括由参与者创建和分享的数字媒体。导师的角色是为课程提供网络资源、参考资料和背景阅读、介绍一些核心课程内容、任务和活动,以及与讲师或者课程参与者讨论的音频或视频。

除此之外,为了创建一个反映整个社区情况的课程,期待参与者增加他们自己的贡献,并公开彼此分享,通过这种作法建立自己的知识和学习社区。

课程的目的并不是要让参与者学习或者记住一些内容。每个人都带着自己的学习目标进入课程。

在一个大规模的在线公开课中,内容比任何个人都多,更不用说记忆了。因此,每个人在课程中的体验是独一无二的,参与者的互动受每个人对这些材料的个人视角所驱动。

关联主义课程的学习是新兴的,它不是被定义、转移或者传递的,而是通过个人经验和互动过程创造的。对于课程中的每个人来说,这门课是新的、与众不同的;在更广泛、更社会化的意义上,它也是整个课程的结果。

0. E-learning 1 and 2

我们正在进入万维网的第三个阶段,它将重新定义在线学习(online learning)。

第一阶段的互联网(web 1.0)最初发展于 1994 年,基于客户端-服务器模式,侧重于网页和文件处理。

第二阶段 web 2.0 时代,创建了一个基于数据和平台互操作性的网络。

互联网第三阶段 web 3.0,平台所发挥的中心作用被削弱,倾向于同行之间的直接交互,也就是分布式网络。

第一代网络由内容管理服务(content management services, CMS)主导,从简单的网页服务器到数据库驱动。学习管理服务(learning management services, LMS)是一个具有教育意图的 CMS. 第二代互联网服务的兴起使得人们可以互相交换内容和媒体。

这个课程将介绍第三代互联网 web3.0, 以及对在线学习的影响。在 web3.0, 我们看到云技术、分布式网络技术的广泛应用,以及开放数据和个人加密技术。

web3.0 的内容看起来很像 web1.0 和 web2.0,仍然会有文件、网页、视频。但是这些媒介将通过分布式内容网络进行获取,通过散列算法(hash algorithms)和数字密钥(digital keys)加密,并且可以动态地实时更新内容。我们将访问分布式应用程序,从而使我们可以获得数据流。这些数据流可能是数字货币、在线体育广播、政府统计资料或者学习应用程序。

在 web3.0 时代,通过这些分布式资源学习,这会是一个导航、混合、重组资源、并将他们应用于真实的挑战和现实世界问题的过程。一方面,e-learning 3.0 将以个人自身利益为出发点培养个人技能;另一方面,与同事和同行合作开展工作和学习,在就业和业绩支持网络内培养能力。

大规模网络公开课(MOOC)介于 web2.0 和 web3.0 之间。它期望在资源和个人课程开发和管理方面建立去中心化的网络,但它依赖于社交网络和在线学习平台等 web2.0 工具。

因此,虽然在线学习3.0(e-learning 3.0)在很多方面预计使用连接主义的学习形式,但工具、过程、结果都是新的。这门课程成为一组链接数据源,其中的链接不仅由教育机构定义,而且由参与者和学习者定义,并且来源从多样的环境中提取和传递到多重环境中。

在这节课的演讲视频「E-Learning3.0——下一波新兴学习技术的影响」里,Stephen Downes 概括性的介绍了 E-Learing3.0 的 9 个核心概念:

  1. Data
  2. Cloud
  3. Graph
  4. Community
  5. Identity
  6. Resources
  7. Recognition
  8. Experience
  9. Agency

Q1:分布式(distributed)和去中心化(decentralized)之间的关系是什么?

根据文章 What is the difference between decentralized and distributed systems? ,去中心化系统是分布式系统的子集。两者主要的区别在于 如何/在何处做「决策」,以及信息如何在系统里通过控制节点共享。
1_nnpzTe1hx74WKICL3Gj34A.jpeg

Decentralized means that there is no single point where the decision is made. Every node makes a decision for it’s own behaviour and the resulting system behaviour is the aggregate response.

去中心化意味着没有单一节点做决策。每个节点决定自己的行为,结果系统行为是聚合响应。

Distributed means that the processing is shared across multiple nodes, but the decisions may still be centralized and use complete system knowledge.

分布式意味着在多点之间共享,但是决策可能仍然中心化,并使用完整系统知识。