首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

使图像文本具有语义并且可搜索(2)

使图像文本具有语义并且可搜索(2)

Web 是语义媒介HTML 和 XHTML 的根源是 SGML(Standard Generalized Markup Language)。SGML 的创建是为了组织和标记文档。图像只不过是 SGML 的衍生物。尽管图像是一个问题,但 SGML 最终围绕的主题还是文本。这也是 HTML 的起因:本质上是在 Web 可访问的页面上显示文本。引人注目的样式因素都是额外的。
但是当图像开始包含文本时,这一切都改变了。Web 上弹出的许多页面 只不过是一堆图像,它们带有一个出现在 img标记上的随意的 alt或 title属性。尽管 HTML 和 XHTML 严格要求图像具有 alt属性,但文本已成为一种累赘。图像使设计人员创建漂亮的页面更加容易,而不必担心这些页面在其他用户系统上 “被丑化”。图像将以相同的形式在任意系统上显示(除非出现分辨率和颜色方面的问题,这是另一篇文章的主题)。随着图像使用越来越广泛,文本的作用开始逐步下降。
文本非常重要乍一看,文本在现代 Web 页面上的衰退似乎不是个大问题。如果 Web 的主要目的是交流消息,图像是最好的 —或者至少提供了清晰的通信 —但充满图像的页面会造成问题吗?或者 全是由图像组成的页面?
答案是肯定的:可以! Google 比任何其他公司都更好地展示了这一点。Google 像大多数搜索引擎一样搜索 Web 中的 文本!没错,Google 不能解释内嵌有文本的图像。Google 的搜索器会忽略图像,同时也忽略了嵌入在其中的产品说明(不管多么美观)。搜索引擎完全不考虑您的站点有多么漂亮,相反,它们关心的是 HTML 里面的内容。如果 HTML 中全是 img标记,您的站点的 URL 将很难进入 Google 搜索结果的前 100 位,即使输入的关键词与您的站点几乎 完全匹配。
如果您要查找图像中消息,Google(实际上大多数搜索引擎都是这样)就无能为力了。大多数人的主页就是 Google 或 Yahoo! 搜索引擎。大部分 Web 会话都是以搜索开始。这意味着除非别人拥有您的 URL,否则他们在没有帮助的情况下将找不到您的站点。并且,不管您的站点的 外观多么漂亮,搜索引擎都不能找到它的文本文字(文字的含义就更不用提了)。
不要忘记可访问性首先,Web 是为需要信息的人提供信息的场所,而 不考虑他们的限制。10 年前,人们认为要让有视觉障碍的人(甚至盲人)使用 Web 是非常可笑的;但今天却实现了。事实上,如果您期待自己的站点得到民众和政府机构的认可、使用,甚至褒奖,您必须确保网站是可访问的。这是必须的,没有选择的余地。
那么,可访问性和图像有什么关系呢?可访问性意味着什么呢?就 Web 页面来说,它可简单归结为:屏幕阅读器或类似设备可以解释页面,并通常通过声音的形式将其上的内容传播给其他有障碍的人。显然,屏幕阅读器和 Google 搜索引擎一样对您的图像一筹莫展。再一次,您只剩下通常被忽略的 alt标记来表示大量图片操作后生成的少量文字。alt标记常常不够用,这是意料之中的。
最重要的文本是标题……页面上最重要的文本是什么?问问别人,您将听到关于热销产品的介绍、一个标语或名人推荐。但这些答案的前提是别人知道您卖什么产品、谈论什么问题或支持什么。这个信息来自于页面的标题。它通常是页面文档头部的 title标记内的文本,但它也通常突出地显示在一个良好站点的每个页面上。打开几个 Web 站点,您通常会在页面的顶部看到标题,并且左上角存在一个图标化的标题。
……最重要的文本通常是图像化的当然,您也希望和标题一样重要的内容能够引人注目。因此,可以打开 PhotoShop,选择一个独特的、好看的字体,然后……屏幕阅读器和搜索引擎找不到它!虽然您已经在文档的头部显示了标题,但重复是个不错的方法,它将向屏幕阅读器、访问者和搜索引擎表明这是重要的内容。因此,尽管 Web 设计人员大量使用规范的、非图像的文本,他们仍然用图像表示 Web 页面的标题。
Web 页面具有多个层最后,解决方案是什么呢?幸好没有回到从始至终都是文本的 Web 设计模式。这里不是要抛弃您已经创建的漂亮图像,或每个页面的标题一定要使用 Arial。解决方案将把 HTML 和 XHTML 的文本历史和功能与 CSS 结合起来,各用其长。
结构、内容和显示从更加具体的角度看,您的 Web 页面需要包含几个组件:结构、内容和显示。页面 结构就是 HTML 和 XHTML 标记。body、div、li和 p都是结构元素。它们定义页面的组织,并划分内容的不同部分。
内容就是页面的文本。虽然可以更宽泛地定义内容,但这里为了方便讨论,内容就指页面结构内的文本。当然,如果这样看待内容,基于图像的文本明显就 不属于页面的内容。内容被替换为图像。将内容看成纯粹的文本是很有局限性的,但考虑到不能解释图像的 Google、屏幕阅读器和软件时,还是很恰当的。对 Google 而言,内容 就是文本。
最后一个部分是 显示,它是最神奇的。图像、颜色、字体风格、字体大小,甚至所有现代 Web 页面的滚动、拖放效果都属于这个类别(尽管有时需要 行为组件来驱动动作)。基于图像的文本的类别属于显示,而不是内容。问题是所有软件驱动的东西都会完全忽略显示,比如搜索引擎或残疾人帮助程序。
层的放置最实际的,也是设计 Web 页面的第一步,就是这 3 个层是垂直的。换句话说,您不能选择为一行文本提供内容 显示。您必须分层放置层(这似乎很愚蠢,不管这句话写得多明显,大多数人都会忽略它)。内容在结构的 “上面”,而显示则在内容的 “上面”。您在 CSS 中应用的样式会影响到内容,但它通常是位于该内容的 “上面” 的层。显示层不会覆盖内容层,它只是增强后者。
但如果显示和内容属于层,为何仅通过显示层来加强内容层呢?相反,假设您想用显示完全 覆盖一片内容。或者假设您希望使用一些内容 —比如非常棒的页面文本标题 —并在该文本的 “上面” 放置另一个版本的漂亮的、高分辨率的、基于图像的标题。这样,您就可以同时受益于内容和显示。Google  等搜索引擎可以识别、分类和索引您的文本内容,并且屏幕阅读器可以处理精确的文本内容。并且喜欢漂亮字体和感官的人,只能看到最顶层,即显示。
返回列表