列举你身边的图像识别、人脸识别案例、文字识别应用案例,试想还有哪些改进或创新之处?

贝壳隐私政策 概要及正文

最新更新日期:2022年09月19日

贝壳隐私政策  概要

尊敬的贝壳用户:我们非常重视客户个人信息及隐私权的保护,并希望通过本概要向您简洁地介绍我们如何处理和保护您的个人信息。如您希望了解我们详细的隐私政策,请查阅本概要后的隐私政策正文。

一、 我们如何收集和使用您的个人信息

或拨打我们的客服电话(010-)。


最新更新日期:2022年05月14日

尊敬的贝壳用户:贝壳平台服务提供者(包括贝壳平台的互联网信息及软件技术服务提供者 天津小屋信息科技有限公司,以及贝壳平台的运营服务提供者 贝壳找房科技有限公司和贝壳技术有限公司,以下亦称“贝壳”或“我们”)非常重视客户个人信息及隐私权的保护,因此我们制订了涵盖如何收集、存储、使用、共享和保护客户信息的隐私政策。为《贝壳隐私政策》(以下简称本隐私政策)之目的,贝壳平台系指包含二手买卖房源信息服务及交易保障服务(二手平台)、租赁房源信息服务及在线交易服务(租赁平台)、新房信息服务(新房平台)、家庭装修信息服务及交易服务(装修平台)、社区生活信息及交易服务(社区生活)。

请仔细阅读本隐私政策的全部条款(尤其是以加粗方式显示的内容),确认您已完全了解我们对您个人信息的处理规则,并作出您认为适当的选择。阅读过程中,如您有任何疑问,可联系我们的客服(电话010-)或者我们设立的个人信息保护专职部门(电子邮件kefu@)及贝壳客户端、M站、小程序等互联网端口。

贝壳平台服务提供者:指贝壳平台的互联网信息及软件技术服务提供者天津小屋信息科技有限公司(注册地址为天津经济技术开发区南港工业区综合服务区办公楼C座一层112室59单元)、以及贝壳平台的运营服务提供者贝壳找房科技有限公司(注册地址为天津经济技术开发区南港工业区综合服务区办公楼C座一层112室24单元)和贝壳技术有限公司(注册地址为天津经济技术开发区南港工业区综合服务区办公楼C座一层112室05单元)。

9、 极验SDK(GT OneLogin SDK)读取您的手机号码和设备信息(设备系统、设备型号、设备品牌和屏幕尺寸等),以根据您的指令实现账号一键登录,武汉极意网络科技有限公司,/Private

10、LiteAVSDK,使用您的摄像头功能、麦克风功能,以确保您能够使用直播功能并与其他使用者进行互动交流,同时读取您的手机状态,以确认在电话呼入时,停止音频采集,腾讯云(北京)有限责任公司,/document/product/301/11470

iOS系统中我们使用的第三方插件如下:

 1、百度地图(baidu_map)收集您的设备标识信息(Android ID、IDFA和IDFV)、其他设备信息(操作系统版本、设备品牌及型号)、位置信息以及网络状态信息,为您提供地图找房、AI找房以及其他根据位置找房的房源信息服务;北京百度网讯科技有限公司/zt/client/privacy//wiki/开发者协议

3、人脸识别(liveness-interactive-online)在您使用人脸识别功能时,收集您的设备信息(设备类型、设备型号、操作系统及硬件相关信息和网络状态信息),使用拍照功能以实现身份认证信息的读取,北京旷视科技有限公司,.cn/privacy-policy/;杭州尚尚签网络科技有限公司,/account-center/legal-agreement/privacy-policy

4、数字联盟可信ID,收集您的设备信息(设备制造商、设备型号和设备系统版本等),以根据您的操作指令,判断设备唯一性和进行有效性检测。北京数字联盟网络科技公司/main//Private

6、LiteAVSDK,使用您的摄像头功能、麦克风功能,以确保您能够使用直播功能并与其他使用者进行互动交流,腾讯云(北京)有限责任公司/document/product/301/11470

以上插件会根据产品功能收集您的个人信息,我们仅会在您授权同意开通相关功能或在您主动使用相关功能我们给予充分提示时,才会将您的对应个人信息接口授权给上述第三方插件。

四、我们如何保护和保存您的个人信息

(一)我们保护您个人信息的技术与措施

我们非常重视个人信息安全,并采取一切合理可行的措施,保护您的个人信息:

贝壳采取安全技术和管理措施来防止您的个人信息遭到未经授权访问使用、公开披露、使用、修改、损坏或丢失,包括但不限于:

(1)贝壳采取加密技术对用户个人信息进行加密保存,并通过隔离技术进行隔离。在个人信息使用时,例如个人信息展示、个人信息关联计算,我们会采用包括内容替换在内多种数据脱敏技术增强个人信息在使用中安全性;

(2)贝壳采取严格的数据访问权限控制和多重身份认证技术保护个人信息,避免数据被违规使用;

(3)贝壳采取数据访问日志分析技术进行个人信息安全审计。

2、贝壳为保护个人信息采取的其他安全措施

安全制度保障。贝壳发布了《数据安全管理制度》和《个人信息保护指引》,通过制度规范贝壳各部门对个人信息所采取的管理措施。

安全认证和服务。我们存储您个人数据的系统通过公安部安全等级保护三级测评。底层云技术取得了数据中心联盟颁发的“可信云”认证三级认证。

加强安全意识。我们会举办安全和隐私保护培训课程,加强员工对于保护个人信息重要性的认识。

3、我们建议您使用电子邮件、即时通讯、社交软件等交流工具时使用复杂密码,并注意保护您的个人信息安全。

4、我们将尽力确保您发送给我们的任何信息的安全性。如果我们的物理、技术、或管理防护设施遭到破坏,信息被非授权访问、公开披露、篡改、或毁坏,导致您的合法权益受损,我们将承担相应的法律责任。

为应对个人信息泄露、损毁和丢失的风险,贝壳制定了多项制度并成立了应急响应团队。我们按照安全事件的处置规范,针对不同安全事件启动安全预案,进行止损、分析、定位、制定补救措施、联合相关部门进行溯源和打击。

在不幸发生个人信息安全事件后,我们将按照法律法规的要求,及时向您告知:安全事件的基本情况和可能的影响、我们已采取或将要采取的处置措施、您可自主防范和降低风险的建议、对您的补救措施等。我们将及时将事件相关情况以邮件、信函、电话、推送通知等方式告知您,难以逐一告知个人信息主体时,我们会采取合理、有效的方式发布公告。同时,我们还将按照监管部门要求,主动上报个人信息安全事件的处置情况。

6、如果您发现自己的个人信息泄密或我们存在有安全弱点、可疑安全事件时,尤其是您的账户及密码发生泄露,请您立即通过本隐私政策最下方约定的联系方式联络我们,以便我们采取相应措施,禁止私自尝试或验证弱点。

7、如果您对我们的个人信息保护有任何疑问,可通过本隐私政策最下方约定的联系方式联系我们。

(二)您个人信息的保存

1、您的个人信息将会被存储于中华人民共和国境内。如您使用跨境交易服务,且需要向境外传输您的个人信息完成交易的,或基于其他必要的业务需要确需将您的个人信息传输至境外,我们会单独征得您的授权同意并要求接收方按照我们的说明、本隐私政策以及其他任何相关的保密和安全措施来处理这些个人信息。

2、当您成功申请注销贝壳账户后,我们将在您提出申请的48小时内完成对您的账户注销审核,审核通过后,我们将对您的个人信息进行删除或匿名化处理。

3、如果我们终止服务或运营,我们会至少提前三十日向您通知,并在终止服务或运营后对您的个人信息进行删除或匿名化处理。

五、您如何管理您的个人信息

贝壳非常重视您对个人信息的关注,并尽全力保护您对于您个人信息访问、更正、删除以及撤回同意的权利,以使您拥有充分的能力保障您的隐私和安全。您的权利包括:

1、访问和更正您的个人信息

除法律法规规定外,您有权随时访问和更正您的个人信息,具体包括:

(1)您的账户信息:PC端您可以在“我的贝壳”页面的“编辑资料”菜单中查阅您提交给贝壳的所有个人信息,您也可通过上述途径更新除实名认证信息之外的其他个人信息(您的实名认证信息是您通过实名认证时使用的姓名和身份证信息)。如您需要变更您的实名认证信息,您可拨打010-服务热线申请变更。移动端APP具体路径为:账户名称、个人资料信息:首页--“我的”进入我的贝壳--点击头像进入账户设置;账户密码、电话号码、安全信息:首页--“我的”进入我的贝壳--点击头像进入账户设置。

(2)您的浏览信息:您可以访问或清除您的搜索历史记录、查看和修改兴趣以及管理其他数据。移动端APP路径为:搜索历史记录:首页--“我的”进入我的贝壳—搜索条件;关注及其他数据:首页--“我的”进入我的贝壳-二手房关注、新房关注、租房关注、小区关注。

(3)您的评论信息:PC端您可以访问或更新或清除您的个人评论,移动端APP路径为:我的—看房记录--评价。

(4)对于您在使用我们的产品与/或服务过程中产生的其他个人信息需要访问或更正,请随时联系我们。我们会根据本隐私政策所列明的方式和期限响应您的请求。

(5)您无法访问和更正的个人信息:除上述列明的信息外,考虑到不响应请求可能给您合法权益带来的风险和损害、技术可行性及实现请求成本等因素,您的部分个人信息我们还无法为您提供访问和更正的服务,这些信息主要是为了提升您的用户体验和保证交易安全所收集的您的设备信息、您使用附加功能时产生的个人信息。上述信息我们会在您的授权范围内进行使用,您无法访问和更正,但您可联系我们进行删除或做匿名化处理。

您在我们的产品与/或服务页面中可以直接清除或删除的信息,包括看房记录、订单信息、浏览信息、收货地址信息;

在以下情形中,您可以向我们提出删除个人信息的请求:

(1)如果我们处理个人信息的行为违反法律法规;

(2)如果我们收集、使用您的个人信息,却未征得您的同意;

(3)如果我们处理个人信息的行为违反了与您的约定;

(4)如果您注销了贝壳账户;

(5)如果我们终止服务及运营。

若我们决定响应您的删除请求,我们还将同时通知从我们获得您的个人信息的实体,要求其及时删除,除非法律法规另有规定,或这些实体获得您的独立授权。当您从我们的服务中删除信息后,我们可能不会立即备份系统中删除相应的信息,但会在备份更新时删除这些信息。

3、改变您授权同意的范围或撤回您的授权

您可以通过删除信息、关闭设备功能、在贝壳网站或软件中进行隐私设置等方式改变您授权我们继续收集个人信息的范围或撤回您的授权。您也可以通过注销账户的方式,撤回我们继续收集、处理您个人信息的全部授权。

请您理解,每个业务功能需要一些基本的个人信息才能得以完成,当您撤回同意或授权后,我们无法继续为您提供撤回同意或授权所对应的服务,也不再处理您相应的个人信息。但您撤回同意或授权的决定,不会影响此前基于您的授权而开展的个人信息处理。

您可以在我们的APP端申请注销账户,具体路径为:首页-“我的”-点击头像进入“我的个人信息”- 注销账号。您注销账户的申请通过后,我们将停止为您提供产品与/或服务,并依据您的要求,除法律法规另有规定外,我们将删除您的个人信息。

您的账户一旦注销,将面临如下风险及问题:

(1)账户在贝壳系统中尚有资产或虚拟权益(包括但不限于账户余额、虚拟货币、优惠券等)且您在申请账户注销前未予处理的,相关记录可能被删除且无法恢复。因此,我们建议您在申请注销账户前,妥当处理您的账户在贝壳系统中的资产或虚拟权益,例如将账户余额提现至银行卡等;

(2)账户内未完成的订单、服务会因您账户注销而无法继续执行,如您已完成支付义务,已支付的权益有可能无法返还。因此,我们建议您在申请注销账户前,确认账户内是否仍然存在未完成的订单、服务(特别是那些已完成支付义务但尚未最终交付的订单、服务);

(3)如您的账户因违法违规操作或侵犯他人合法权益导致处罚或纠纷,或者我们为履行反洗钱等法律义务,我们将在法律允许的必要的期限内保留处理此处罚、纠纷或投诉所必要的信息,以及履行反洗钱等法律义务所必要的信息,并在该等期限届满后对相关个人信息进行删除或匿名化处理。

5、如果您不想接受我们给您发送的促销信息,您随时可通过以下方式取消:

(1)您可通过PC端账户设置页面的邮件订阅菜单中取消邮件订阅的促销信息。

(2)您可以随时回复“TD”来取消我们给您发送的手机促销短信。

(3)您可以通过移动端APP“账户设置-设置-推送消息设置-通知”设置是否接受我们通过“通知”推动给您的商品和促销信息。

(4)您可以通过移动端APP“账户设置-设置-推荐设置”设置是否接受我们为您专属推荐的精选房源。

(5)我们会与第三方的平台或媒体(“平台”)合作基于您的个人信息向您推荐个性化的商品或服务。这些个人信息包括诸如在本网站的产品与/或服务的使用情况、访问本网站关联公司网站的情况及您在您的账户设置中填写的兴趣爱好。平台仅向我们提供了展示商品的窗口,窗口内容的链接是贝壳站内的个性化商品展示信息,由贝壳进行管理,因此我们不会向广告商提供您的任何的个人信息。而且我们在推荐窗内设置了屏蔽功能,您可选择屏蔽您不喜欢的广告。如您不愿意接受贝壳在单个平台上的推荐服务,请联系平台进行关闭。您知晓并理解平台是自主经营的实体,贝壳无法对其进行管理。

(6)为了保护您的隐私,我们不会以任何方式和途径向您推送涉及宗教信仰、性、疾病等相关敏感内容的促销或商品信息给您。

如果您无法通过上述方式访问、更正或删除您的个人信息,或您需要访问、更正或删除您在使用我们产品与/或服务时所产生的其他个人信息,或您认为贝壳存在任何违反法律法规或与您关于个人信息的收集或使用的约定,您均可以发送电子邮件至service_beike@ 或拨打我们的客服电话(010-)等多种方式与我们联系。

2、我们设立了个人信息保护专职部门(或个人信息保护专员),您可以通过发送邮件至的方式与其联系。

3、一般情况下,我们将在十五日内回复。如果您对我们的回复不满意,特别是我们的个人信息处理行为损害了您的合法权益,您还可以向网信、电信、公安及市场监督管理等监管部门进行投诉或举报,或者向有管辖权的法院提起诉讼。

我们谨此再次提醒您,本隐私政策内容中以加粗方式显著标识的条款,请您着重阅读。您点击注册”/“登录”按钮即视为您完全接受本隐私政策,在点击之前请您再次确认已知悉并完全理解本隐私政策的全部内容。

}

本文来自于,未经作者同意,请勿转载,原文地址:

Dev Club 是一个交流移动开发技术,结交朋友,扩展人脉的社群,成员都是经过审核的移动开发工程师。每周都会举行嘉宾分享,话题讨论等活动。

本期,我们邀请了 腾讯 TEG 技术工程师“文亚飞”,为大家分享《深度学习在OCR中的应用》。

大家好,我是文亚飞,来自腾讯TEG,目前负责图像识别相关的工作。OCR(光学字符识别)旨在从图片中检测和识别文字信息,本次分享将介绍我们在OCR技术研发过程中的一些方法和经验总结。

一,OCR背景及基本框架介绍

OCR技术从上世纪60年代就开始得到重视和研究,开源OCR框架Tesseract[14]始于1985年,至今仍在不断迭代和优化。从早期的通用扫描文档识别(谷歌数字图书馆,ABBYY,汉王,文通等),到银行卡/身份证/金融票据等证件识别(百度,微信,支付宝)以及车牌识别,OCR在业界也积累了非常多的宝贵经验。针对不同的应用场景,OCR所用到的方法也会有所不同。

我们这里将主要分享在通用图片下的文字检测与识别。

我们把通用图片分为两类,字迹清晰背景单一的简单图文和字迹模糊背景多变的复杂图文。

上图分别对应简单图文和复杂图文

复杂图文的文字检测和识别压力很大,非常具有挑战性

这是一般的OCR框架流程图,基于一般的ceiling analysis,文字检测和文字识别是最具挑战也是能够最大程度提升整体框架表现的两个主要模块。

传统方法大都需要依靠手动提取特征来训练检测模型和识别模型,由于底层特征与高层语义之间特有的语义鸿沟,当应对多类字体变化以及复杂背景干扰的时候,单一的特征选择或分类器的调优就显得相形见绌了。卷积神经网络LeNet-5第一次在mnist手写数字识别上得到成功的应用,而近些年随着计算硬件成本的降低以及几项深度学习关键技术的突破,AlexNet、VGG、GoogleNet、ResNet等在imageNet、LFW上取得了令人傲娇的表现,开启了深度学习在大规模数据训练和学习的浪潮。

针对OCR传统手法在应对复杂图文场景的不足,我们对文字检测和文字识别这两个关键步骤结合深度学习进行研究与开发。

从上图可以看到,不同于人脸和行人,文字的均值图更像是一种噪声,其组成部位即无固定位置,数量也不固定。这表明文字检测并不能简单的借用人脸/行人检测等常用目标检测框架,一步到位的由图像得到文字区域标定的端到端方法很有压力。

通常,一般的文字检测方法可以分为两类:

  1. 基于滑动窗口全图扫描的自上而下的方式。对每个滑动窗口基于HOG、Gabor、LBP、Haar等纹理特征训练Adaboost,SVM,MLP等二类分类器得到文字区域的概率响应值,然后再利用camshift或连通域分析结合形态学等操作定位最终的文字框。该方法对分类器的要求很高,要求能应对各种字体和背景的形式,即便是基于CNN来训练检测模型,大量的扫描滑动窗口对性能耗损十分严重,不适合对性能要求较高的大数据应用场景。

  2. 基于底层规则先分割得到小区域再组合成文字区域的自底而上的方式。通常这类方法利用文字颜色、亮度、边缘信息进行聚类的方式来快速分离文字区域与非文字区域,而以MSER和SWT为代表的连通域分析方法在自然场景文字检测中表现优异,在获得高鲁棒性的同时性能也比滑动窗口的形式提高不少。

我们首先基于MSER(最大稳定极值区域)的方法来设计我们的检测方案,如下图。

由于MSER基于分水岭迭代的方式来寻找候选框,能有效提取候选文字区域的同时也容易产生非常多的非文字区域。MSER产生的干扰区域往往跟文字享有类似的纹理特征(如窗户,草地,头发等),我们需要强有力的分类器来滤除干扰。SVM/adaboost等传统手法往往基于人工设计特征训练分类器,很难适应复杂多变场景。

由于过检测模型是候选框数量很大,为了降低性能损耗需要把网络设计得尽可能简单,我们借鉴MNIST的LeNet-5网络来构建一个精简的CNN二分类检测模型。

上图是我们的检测结果示例

早先的传统文字识别手法基本都采用基于模板匹配的方式,对特征描述要求非常苛刻,很难满足复杂场景下的识别任务。深度学习抛弃了传统人工设计特征的方式,利用海量标定样本数据以及大规模GPU集群的优势让机器自动学习特征和模型参数,能一定程度上弥补底层特征与高层语义之间的不足。近些年深度学习在人脸识别、目标检测与分类中达到了前所未有的高度,也开启了深度学习在文字分类的新浪潮。

Google在photoOCR中设计了一套基于HOG特征作为输入的5层CNN网络作为OCR识别模型,该套系统在Google多项产品中得到成功的应用。Goodfellow等人第一次提出用Maxout作为非线性激活单元来构建CNN模型学习通用特征,并随后在文字分类上取得了state-of-the-art的结果。

我们参考Maxout网络模型基于caffe来构建我们的OCR识别模型

在识别网络训练环节,卷积神经网络要识别这类复杂多变的文字,首先面临的挑战就是如何获取足够多的符合多样性的训练样本。只有让训练样本满足字体、颜色、背景等的多样性才能保证训练出符合业务需求的ocr识别网络。

以下我们的OCR方法识别结果示例

ABBYY与汉王类似,更擅长于扫描文档转PFD作业。

而通用场景文字识别,OCR作为图像识别领域非常经典也非常有挑战的研究课题,百度、微软、Google都有强大的研究团队进行研发,也都取得了非常不错的进展。

今天的分享就到此结束了,谢谢大家,欢迎大家一起探讨交流。

Q1:这些技术客户端上有应用吗,效果如何?

我们基础研究这边只负责技术员研发,目前主要用在部门内部需求,尚未对外输出。

Q2:想问一下OCR有没有针对中文繁体字异体字方面的识别技术?在古籍整理方面应该会有比较大的应用

我们目前是支持繁体的,如果要支持其他异体字,只要准备相应的训练集即可。

Q3:请问一下有没有比较轻量级的开源OCR库供app集成,主要使用场景是用于通过卡片图像识别卡号

我们目前的应用场景是大数据业务,对性能要求很高。识别卡号这种具体也许场景一般会做相应的调整,检测可以利用卡号的位置等信息,如果识别的字体比较单一,可以精简训练集,训练一个相对轻量级的识别网络。

Q4:就识别银行卡这个功能,要怎么去做?这知识点是哪方面的?

银行卡和身份证这种属于特定也许场景下的识别,相对本文介绍的通用图片识别压力要小很多。参考问题3的回答

Q5:亚飞老师好,通用场景中要面临不同的环境,比如在移动端应用的OCR技术,在处理不同噪声,模糊,光照不均等情形时,有什么处理经验可借鉴和分享么?

关键是要准备充足的字符训练集,可以根据字符前景和背景生成多个灰度值对,使得训练样本更加丰富

Q6:OCR识别二维码,需要怎么去做?

本次分享的这套OCR技术应该难以应对二维码的识别,可以旋转字体,加干扰,艺术字体,对抗性太强,识别和检测的压力都很大

Q7:识别网络的训练样本大概是多少量级?准确率如何?

训练样本在千万级别,业务场景的识别率在95%以上

Q8:看上面的那个图,对有地图,或者有背景水印的图片. OCR 还是很吃力。主要是文字检测阶段是不是?微信里面的街景扫描原理是怎样的?谢谢!

对,场景文字识别最难的还是文字检测,背景干扰,文字对比度弱等情况下很容易漏检。前面提过,只要训练样本足够,识别基本不会有什么问题的。微信的街景扫描没有体验过。自然场景的文字识别一直是业内挑战最高的一个课题,目前基于深度学习在这方面的研究很多,到工业界还没有非常成熟的算法,百度和google是业界最好的。

Q9:当面对不同背景和图像畸变时,你们一般会如何应对,更倾向于在预处理缓解规范化,还是在训练样本中加入多样化的样本?

后者。不过检测到整行文字倾斜是可以考虑先做方向矫正再送识别。

Q10:能用来识别车牌吗?考虑对车牌拍摄时的光照,角度等因素。

可以。不过车牌的检测算法很成熟了,可以先检测到车牌,做方向矫正后再送识别。车牌银行卡这种文字类别相对很少,不到100个,一般传统的模板匹配的方法也可以达到比较好的效果。而本文介绍的通用图片的文字识别需要应对6000多个汉字还有英文数字等,对网络的要求更高

Q11:问题:除了基于CNN的识别方法,有没有尝试过其他的深度学习算法。比如RNN,是否对于粘连字符和英文的识别效果会更好?

我们目前是做字符切割之后再送识别,切割对中英文混排压力很大。后续会考虑用基于RNN的LSTM来做整行识别,能避免切割,问题是将会对性能产生影响。

Q12:锤子发布的 big bang,他的检测很精确,尤其对文字语句,段句这块。现场展示将一段化学元素和语句成功段开,对于这个的原理,能解释下吗?这个您对它怎么看?谢谢!

锤子的big bang个人理解跟OCR不大相关。手机应该是可以直接从聊天记录获得文本,不需要从图像里去检测和识别文字,主要涉及到的是NIL方向的算法,比如分词。

更多精彩内容欢迎关注的微信公众账号:

是一款专为移动开发者打造的质量监控工具,帮助开发者快速,便捷的定位线上应用崩溃的情况以及解决方案。智能合并功能帮助开发同学把每天上报的数千条 根据根因合并分类,每日日报会列出影响用户数最多的崩溃,精准定位功能帮助开发同学定位到出问题的代码行,实时上报可以在发布后快速的了解应用的质量情况,适配最新的 iOS, Android 官方操作系统,鹅厂的工程师都在使用,快来加入我们吧!

}

我要回帖

更多关于 人脸识别案例 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信