说明:该文完成于2012年2月20日,是本作者为完成本职工作,提高工作效能自制信息化平台的总结分析报告
。报告涉及相关数据见原始数据(查看密码5782)。本文没有正式发表过。
怎样的资源在教育网站注①上有高的访问数?是每个教育资源制作者所关心的问题。有高的访问数,意味着这类资源是用户所欢迎的,就资源制作而言,其价值就得到了有效体现,制作前的决策、设计,过程中的投入是正确和有回报的;反之,则是一种错误的决策和浪费。
那么究竟怎样的资源才真正符合教育的需求,为用户所关注?本文就此问题作一分析研究。
就常规的教育网站而言,上网的资源可分为下列几类:
①文件通知类。这类资源往往由教育行政或管理部门发布,带有很强的时效性。也就是说,在某一时间段内,该类资源会受到访问者的特别关注,并被下载和传播,以便贯彻执行;但过了此时间段,受关注的程度会大大降低,甚至无人再次访问。关于此点,后面会有具体的数据证明。
②论文类。这类资源为教师个人撰写,是教育工作的结晶,较受欢迎,特别是关于教育工作前沿的话题,在某一时段内会特别受人关注。这类资源受关注的原因主要是可作为教育工作的借鉴和撰写论文时的参考,所以这类资源必须要有一定的质量才会得到关注。泛泛的心得体会、教育过程描述不会有高的访问数。但有一例外,若写稿人很有名,其应景之作也会受到关注。
③教学参考类。这类资源以描述具体的教学方法和教学要点为特色,还有记录具体教学过程的教学实况,对教师完善教学有一定帮助。
④教学媒体类。这类资源内容较广,包括各类课件、积件、图片、视频和音频,极受欢迎。但真正有价值的获取不易。因教学存在差异,成品课件很难直接使用;而各媒体单元,如积件、图片、微视频等若要适用,必须要有完善的检索系统,但这点很难做到。这类资源往往有著作权的问题,使用率还受到授权和费用的限制。根据初步的测试分析,该类资源具有很强的即时需求性和严重依赖搜索引擎检索的特点(具体测试过程见后文),在具体的教学过程中真正发挥作用不易。
⑤背景学习类。这类资源对学生的学习有一定的帮助。常常以提供学习的背景资料、具体的难题解答和实用化在线练习的方式出现。从实际的数据分析看,以难题解答示例,特别是作业练习中有类似题目的资源最受欢迎。
⑥学习拓展类。这类资源与具体的教学关系不紧密,属于知识资料,供有兴趣的人阅看。
上述这几类资源,在各类教育网站上的分布并不均衡,与网站所有者的身份有关。现实的存在决定了每个教育网站的资源特色。
对于各级教育行政部门拥有的门户网站,资源以辖区内的教育新闻、文件通知为主,传递的是教育的大众方针和行为规范,网站内容公开透明。具体教学单位的门户网站,常是单位宣传的窗口,内容涉及学校的方方面面,但因最终内容负责人一般是学校领导,学校的整体呈现较多,对教学细节常忽略不计。发布资源权限严格的,以校内动态为主;宽的,则各类资源均有。但有一点几乎带有共性,那就是好的资源只供内部共享,外人无法获取。依靠教育生存的专业公司的网站,往往资源更贴合教育的需求,搜索也规范。这类网站,常在前台放置有吸引力的引子,但到关键点时只有会员才能阅看,且最终会体现到费用上。并且这类网站怕资源被无偿使用,资源信息都经过技术处理,无法为通用的搜索引擎检索。按实际教育资源需求的测试(见后文),大部分教学中的资源需求表现出即时性,即需求者只在需要时才会去搜求特定资源,行为上试图通过搜索引擎直达资源提供页面,而这种资源获取方式,使得专业公司提供的资源无法方便地为具体的教育过程服务。那些不为即时运用服务的资源,如在线教学、课堂视频在这类网站中才有价值。最后有一类教育网站是由教师个人建立的,其一般为具体专业的课堂教学服务。其上的资源往往有学科烙印,较贴合教学的需求,带有明显的个性特点。
这四种来源的教育网站资源各有其特点,受众不尽相同,产生的作用差异明显。但任何说法都要有数据支持,否则无法令人信服。
下面是作者的两次网络教育资源的测试分析,依托的是自写代码的网站平台。第一次测试(说明一)时间区间在2004年5月18日至2006年5月18日,以课堂用小学语文教学视频为测试载体,对教育用户的需求行为进行记录分析;第二次测试(说明二)时间区间在2007年9月29日至2012年9月14日,提供的资源涉及教育的诸多方面,对教育用户具体的点看行为进行记录分析注②。为分析条理明晰,将第一次测试结果作为第二次测试的媒体部分的一个内容加以分析。
第二次测试网站的数据主要分为三块记录:①文件通知类;②文章、图片类;③视频、音频类。
先就文件通知类进行分析。文件通知有两部分,现对建有单独数据库的部分进行分析。该数据库自2008年9月8日始到2012年9月10日止共计143份注③。访问数分布如下图:

图一
横坐标取文件自然编号,纵坐标取访问数。可见,该类资源的访问数差异极大,最高达565次,最低仅2次,这两个极端的文件分别为2009年12月8日发布的“2009苏州市教师教育技术能力竞赛暨十佳网络教学团队评比活动参赛须知”和2008年12月9日发布的“关于召开苏州市2009年春季电教教材征订会的通知”,前者为苏州大市内层层选拔性的教师比赛,证书盖苏州市教育局章,教师评定职称时认可;后者仅涉及少数负责者。可以看出,该类资源与涉及对象关系密切:涉及面广及对阅看者价值大,访问数才会大。关于上述论点,下面的数据分析应更有说服力。
本作者在制作文件通知管理系统时,根据当时涉及的工作范围设定了该类资源的类别,共有五个方面:电教教材、会议通知、教师比赛、课题管理和学生比赛。下面是该类资源分类后的平均访问数与资源类别的柱状关系图:

图二
该表由工作网站的文件通知数据(见注③的原始数据)生成,纵轴为资源的平均访问数,横轴为发布的文件类别。其中,与教师个人密切相关的教师比赛类的关注度远远高于其它类别的文件。
前已说过,该类资源具有时效性。随着时间的推移,访问数会有一定增加,但增量幅度小。得出此结论,源自下面对相隔一年五个月的访问数据差异的分析。

图三
该图是由共同的开始日期2007年9月29日,不同的截止日期2012年9月和2011年4月注④两个数据库生成。两库具有继承关系。有比较意义的是两者重合的部分,共89个文件。可以明显看出,该类资源随着在网时间的延长,受关注的程度趋弱。在图上可看到,2011年4月止数据库中的最后几个文件的受访问数与最终的受访问数偏离较大,这主要是最后的几个文件上网时间不久,访问数尚未趋稳所致。
小结如下:教育网站的文件通知类资源,(一)只有阶段性的价值;(二)资源的关注度(通过访问数来体现。访问数大,关注度就高;访问数小,关注度就低)随着与教师个人的关系程度而变化,密切的,关注度就高;反之,则低。这也反映出教育网站的文件通知类资源的访问对象主要是教师,这类资源的制作应根据教师的情况而设定。
关于普通文章类资源的分析。就常规的认知,关注度高的文字材料,特别是有持久被阅读价值的文字材料应特别受到教育网站制作者和管理者的重视。那么究竟怎样的内容才符合上述要求呢?

图四
上图是根据第二次测试网站上共603篇文字材料注⑤访问数生成的访问统计图。横坐标是网页的次序号,纵坐标是访问数。可见,访问数达500以上的并不多,共有9篇。其中论文3篇;目录(电教教材类)2篇;题目(化学)、视频档案、科学、地理各1篇。而低访问数(设为10次以下)的为122篇,占总数的20.23%(说明三)。
在设计数据库时,对文章设置了42个类别注⑥,记录中有低访问数文章的类别共22个,占总42个类别的52.38%。

图五
为表述明晰,本文将某类别中低访问文章数占该类别文章总数的百分比称为占比。由类别的占比数值(数值从高到低排列)与类别编号形成的关系曲线称占比曲线。
从占比曲线可见占比值可分为三个区间:100%;0%和介于两者之间的部分。
统计分析时,若样本过少,数值的偏离具有偶然性,体现在本分析上,有部分类别网页数太少,故价值体现不足,现取某类别中有10个及以上网页数的类别进行分析,应更具价值。下面是符合要求的类别与占比形成的柱状图:
 |
编号 |
文章归类 |
总篇数 |
低点看篇数 |
占比 |
1 |
外国名画 |
14 |
14 |
100.00 |
2 |
文件通知 |
44 |
29 |
65.91 |
3 |
成语典故 |
37 |
23 |
62.16 |
4 |
课题研究 |
20 |
8 |
40.00 |
5 |
小学语文 |
16 |
6 |
37.50 |
6 |
语文参考 |
19 |
3 |
15.79 |
7 |
地理 |
22 |
3 |
13.64 |
8 |
名著简介 |
25 |
3 |
12.00 |
9 |
外国人物 |
34 |
3 |
8.82 |
10 |
中国人物 |
27 |
2 |
7.41 |
11 |
论文 |
135 |
7 |
5.19 |
12 |
目录 |
39 |
2 |
5.13 |
13 |
视频档案 |
69 |
0 |
0.00 |
|
图六(左)和表一(右)
表一是形成该柱状图的数据,共13个类别。可以看到,在5、6类别间有一个较大的跌幅,设定这为内容是否受欢迎的分界。往上,有五个类别,它们有如下特点:时效性强(文件通知),涉及面窄(课题研究),需求性弱(成语典故、外国名画)。往下,有八个类别,它们有如下特点:参考性强(论文等),有检索价值(目录),具可视性(视频档案)。显然,受欢迎程度随着占比值变小而增大。
但在对比一、二两次测试数据时,发现类别中有一个特例:即小学语文。
在第一次测试时,小学语文的资源是作为网站的主要内容而呈现的。该网在线762天,共有23077次独立访问记录注⑦,受关注的程度并不低;但在第二次测试中,小学语文资源仅作为42个类别中的一个而放置在网站中,却表现出受关注度不够高的特点。造成这种差异有两种可能:a.在综合性的教育网站中,单一学科的资源受关注的程度不及仅由单一学科资源组建的网站高。若如此,对资源制作者而言,可推论——学科资源应提供给对应的学科网站,这样更有价值;b.是因两次测试中,选放的资源类型不同而造成了关注度上的差异(第一次测试内容是全方位的,第二次测试偏重课文),但因在做第一次测试时,本作者的网络编程能力还很低,没有对每个独立页面编制代码记录访问数,这一可能仅是猜想。若是,对资源制作者而言,则可得推论——仅考虑访问数,现代媒体资源对学科的价值高于传统的文字资源。因为基础数据的不完整,上述的推论只能是可能。
概括起来,教育网站的资源配置,应根据网站针对的浏览对象而定。网页的内容,要针对教师而设计,要与教师的个人进修,教学参考,课堂教学相适应。
教育网站资源中,有一类极其重要,那就是视、音频资源。可以说,正因为有了网络,才为该类资源提供了便捷的传播渠道。
在测试二中,为教育视频资源建立了专门的页面——视频档案。共有69个。从表一列出的数据可见,这些页面均有较高的访问数。那么,具体到这些页面所关联的视频,被点看的情况又是怎样的呢?
在线进行访问测试的共有77个视频资源注⑧,其中有8个视频没有建立专门的页面,仅能在进入网站后直接访问,导致的结果是这8个视频的内容无法通过搜索引擎明确地获取而被需求者访问。所有视频信息在网月数在33个月到47个月之间,内容均与教学有关。
在设计数据采集时,采用了两种模式:从某一视频的介绍页面(视频档案页面)上的链接访问,及从网站专题页面上直接访问。前者因网页易被搜索引擎收录,需求者可通过关键词发现视频介绍从而访问视频;后者一般要进入网站后才能发现所需视频。为便于表述,设:
视频的每月平均访问数 |
= |
视频被访问数 |
视频在网月数 |
则每月平均访问数与视频编号的关系图表如下:

从上面的图中可看到两点: a.虽然有8个视频没有介绍页面,但并不是没有访问,而是有一定的访问次数。全部77个视频,最低的每月平均访问数为0.05,而8个视频中最低的每月平均访问数为0.18,这说明,教育网站的影响力对网站上放置的教育视频体现价值有正向的作用。而另一个影响的因素是搜索引擎。下面是有介绍页面(为静态页面,能很好地被搜索引擎收录)的69个视频的页面访问数和视频被访问数的对比关系曲线图:

可见,大多数视频的介绍网页访问数高于实际的点看数,说明用户在了解了内容后不能百分百转化为实际的点看行为。为研究方便,将视频介绍网页访问数与视频实际访问数之比称为视频运用转化效率,则:
视频运用转化效率 |
= |
视频介绍网页访问数 |
视频实际访问数 |
基于上面对比关系曲线的原始数据可生成视频运用转化效率随视频变化的关系曲线:

由曲线可见,第二次测试中,视频运用转化效率在0.15到3.76(数值取小数点后两位)。因在编程中,对网页和视频点看采用了一样的计数原则,所以由看网页介绍转化为访问视频对视频运用转化效率的贡献应≤1,这是合理的,若有超过,那是用户访问网站后直接访问视频的结果。显然,引起访问愿望的主要原因:若是由介绍网页引起的,则介绍的文字要贴切合理;若是进入网站后直接访问的,则要给视频起个能很好反映内容的名称。
由上述研究可知,要提高教育视频的使用效能,一要选符合教育需求的好内容;二要起个能真实反映内容实际的好片名;三要建立个能被主流搜索引擎收录的介绍页面。
b.虽然关于这些视频的介绍页面被浏览者访问的次数一般高于其它类别资源,但最终月平均访问数高的教育视频并不多。现划分成三段(原始数据见注⑧),如下表所示:
月平均访问数区间 |
视频个数 |
占总数的百分比 |
3-8 |
8 |
10.39% |
1-3 |
27 |
35.06% |
0-1 |
42 |
54.55% |
下面是月平均访问数在3-8区间的具体视频情况:
视频名称 |
类别 |
月平均访问数 |
适用范围 |
特点归类编号 |
被子植物的双受精过程 |
教学参考 |
7.63 |
中学生物 |
(1) |
贾老师教作文(20)小朋友们谈怎样写作文 |
作文辅导 |
5.34 |
小学作文 |
(4) |
七律•长征 |
教学参考 |
4.87 |
语文 |
(1) |
《金属与金属矿物》 |
课堂实况 |
4.04 |
中学 |
(2) |
《数码摄影艺术》网络课程第一讲 |
学习辅导 |
3.94 |
技能培训 |
(3) |
贾老师教作文(19)编列好作文提纲 |
作文辅导 |
3.21 |
小学作文 |
(4) |
小学艺术课实况《雀之灵》 |
课堂实况 |
3.17 |
小学 |
(2) |
怎样写动物 |
作文辅导 |
3.04 |
小学作文 |
(4) |
这些关注度高的视频很有特点:(1)是教学过程中难以表述内容的直观呈现;(2)是教学过程的呈现;(3)是人们常规技能的获取;(4)是教会解决普遍的教学难点的辅导。
根据测试,教育视频的关注度还与教育视频放置的网站有关。如特点编号为(1)的两个视频内容,本作者现在也放置在自己的个人网站上,但其访问量非常小。这说明,对需求者来说,发现所需视频资源的两个外在因素,搜索引擎收录有所需视频条目和能在已熟知的教育网站中看到,后者更重要。
另一点,根据测试,同样的涉及领域,教学视频受关注的有效性低年级高于高年级。这点在作文方面有初步的证明。
在测试名录中,关于作文辅导共有5个视频,其中3个适合小学;2个适合中学,如下表:
片 名 |
适 用 |
月平均点看数 |
怎样写动物 |
小学 |
3.04 |
贾老师教作文(19) |
小学 |
3.21 |
贾老师教作文(20) |
小学 |
5.34 |
于老师教记叙文(一) |
中学 |
1.59 |
于老师教记叙文(二) |
中学 |
1.19 |
可见,月平均访问数中学仅为小学的二分之一甚至更少。
至于常规教学对音频的需求(英语除外),有,但不大。教学视频的平均月点看数区间在0.05-7.63之间;而教学音频则在0.02-0.67之间注⑨;以0.67为界,有57%的教学视频处在该分界以上,而教学音频则全部在此界限以下。有一个对比,《七律•长征》的视频,平均月访问数为4.87,音频则为0.34,两者访问比约为14.32。
由此可得一个推论:从教学资源的制作角度来看,教学音频的价值较小。
关于教学用视频有一个现象,使用者往往仅在需要时才会借助搜索引擎查找所需视频用于具体的教学过程,即就使用而言,教学视频具有突发性和严重依赖搜索来体现使用价值的特点。得出上述结论是基于第一次测试。
在测试期间,获得测试网站的访问数据如下注⑩:
时间段 |
2004.5.18-2004.8.31 |
2004.9.1-2005.5.31 |
2005.6.1-2006.6.18 |
网站访问总次数 |
503 |
18834 |
3740 |
天数(天) |
106 |
273 |
383 |
平均日访问数(次) |
5 |
69 |
10 |
从数据可知,测试网站共在线762天,其中有489天未被主流搜索引擎收录。从三个时间区段看,网站的访问量,被主流搜索引擎收录的时间段内的数值大大高于未被收录时的数值。
在测试网站登陆主页面及资源下载页面上留有联系信箱地址,获得一组浏览者要求注册并下载资源的联系信件,共计25封,分属16位浏览者(具体内容见原始数据,查看密码5782)。要求注册获取资源的最初联系时间是2004年7月25日,最末联系时间是2005年6月21日,可见与网站被主流搜索引擎收录的时间段几乎重合,由此可以获得一个推论:用户只在需要时才会借助搜索引擎搜求所需媒体资源。对16位咨询者的咨询进行比对,发现有急切使用愿望的共9位,占56.25%,这说明教育用户对视频媒体的需求具有即时的特点。
综合上述分析,要使视频媒体在教育上发挥作用,除媒体本身要贴合教育需求外,提高教育视频媒体的被检索能力至关重要。对咨询者的信件内容进行分析还能发现,同时还要解决注册、付费的便捷问题。
下面对教育网站的文字资源与视音频资源的访问情况作一综合对比。
类 别 |
平均点看数总和 |
资源个数 |
平均值 |
零访问资源数 |
文字资源 |
1077.52 |
603 |
1.79 |
71 |
视频资源 |
100.73 |
77 |
1.31 |
0 |
音频资源 |
3.03 |
18 |
0.17 |
0 |
从资源受关注的数据看,文字资源强于视音频资源,说明在教学上,对网络文字承载内容的需求还是第一位的;其次是网络的教学视频资源。相比较而言,常规教学对网络的音频资源需求不大。在教育上网络的文字资源虽然受关注度高,但有极端的情况出现,在现有数据中,无人关注的约占总数11.77%。因此,教育网站要提高文字资源的利用价值,对文字资源的筛选非常重要。对视频资源,内容选择只要符合教育的需要就会有关注度,主要考虑的应是制作成本。对网络教学音频资源,似乎尚无法与常规的光盘、音带承载的资源进行竞争。
问题:本文的分析和推论建立在已有数据的基础之上。从数据样本数的角度考虑,数据量越大,结论越有说服力。现在依据的样本,文字、视频和音频在测试数量上差距较大,若达到同等数量级,教育用户对资源的需求特性是否会改变?第一、二次测试都建立在匿名的临时用户基础上,若提供注册,建立固定用户群,对教育资源的需求是否会变化?本分析研究对教育图片资源的关注不够,有关数据整合在文字资源中,其特性如何?这些都有待今后的研究。

注①就本文而言,教育网站特指为教育、教学和学生学习提供信息和资源的网站。
注②测试一、测试二具体见原始数据,查看密码5782。
注③原始数据见3、2012年9月14日止文件通知类数据库
注④原始数据见4、2011年4月止文件通知类数据库
注⑤原始数据见5、2012年9月14日止普通文章类数据库
注⑥数据见6、2012年9月14日止普通文章归类数据列表(由2012年9月14日止普通文章类数据归纳而成)
注⑦当时采用的是网易为租空间用户提供的计数器,按访问者的ip地址来统计计数,一日内不重复统计。
注⑧原始数据见7、2012年9月14日止视频类数据库;8、2012年9月14日止视频档案与对应视频数据
注⑨原始数据见9、2012年9月14日止音频类数据库
注⑩(1)平均日访问数取整数;(2)从建立网站到在google、百度等搜索引擎中可查到网站信息约在2004年9月份;(3)2005年6月1起,凡未作网站备案的站点,被特别处理。本文中的试验站点因未备案,在所有搜索引擎中反映的站点资源信息均被删除。
说明一:第一次测试。测试时间:2004年5月18日至2006年5月18日,测试网站:租用网易100兆空间及网易二级域名,建立汇知网,采用的是静态网页方式,提供与教学有关的文字、图片和视频资源,以其中的小学语文教学视频资源信息为载体建立测试模式。测试方法:通过需求者邮件获取对离线媒体的需求信息。相关数据见原始数据(查看密码5782)上1、第一次测试网站界面;10、第一次测试中浏览者要求注册并下载资源的联系邮件。
说明二:第二次测试。本作者在2007年9月29日至2012年9月14日因工作需要,自建了一个工作网站,由苏州教育信息中心提供空间,采用苏州教育二级域名发布。采用了动态、静态网页结合的方式
,内容涉及教育的多个方面,在后台对每个资源的使用情况写了代码进行记录。
说明三:本文数据均精确到小数点后两位。
|