绪论:写作既是个人情感的抒发,也是对学术真理的探索,欢迎阅读由发表云整理的11篇文本分析范文,希望它们能为您的写作提供参考和启发。
《日常用品》塑造了代表传统文化的母亲和代表现代风格的女儿的不同形象,围绕如何理解和继承祖传的被子展开情节,反映了由种族问题引起的家庭矛盾。小说借母女冲突表达了这样一个主题:继承民族文化传统的意义在于深刻地认识理解其文化内涵,而不是浮于表面、流于形式。小说体现出作者难以释怀的黑人情结和沉重的焦虑,这也是作者自我意识的彰显。
一. 词汇方面
1.形容词层面
文中第十三段是形容词所占比例最高的一段,共138个单词,其中形容词共计13个,约占整段字数的9.4%。这些形容词都是简单词汇,其中,good一词重复使用了三次。小说采用第一人称的叙述方式,文中的“I”代表的是一位受教育程度不高的黑人母亲。基于这一点,就不难理解作者为何用词如此简单。此外,该段中主人公在对自己和自己的女儿进行描述时采用的是中性形容词,而对准女婿的描述时,她用mossy来形容他的牙齿,用earnest来形容他的脸,可见主人公对女婿持有偏见或不甚喜欢。
2.副词层面
整篇小说中副词并不多,always一词出现的频度相对很高。在对Dee进行描述时,接连用了多达4个always。Always不仅表示频率很高,还能辅助表达作者蕴含的某种特定的感彩。在此文段中always的频繁使用表达了母亲对女儿很多行为的不解甚至是反感。
二. 句子层面
1. 句子类型
《日常用品》中多为短句和简单句,少有长句、复杂句和倒装句。在母亲和女儿Dee的对话中,70%以上都是疑问句而且大部分是反问句,这些问句多由母亲向女儿发出且几乎都是由“Why don’t you”或“Don't you”引导的,语气非常强烈甚至是愤慨,带有很明显的责备和命令的意味,这可以很好地体现母亲对女儿不同价值观的否定,以及对女儿强烈的控制欲和指导欲,很好地刻画出母亲的威严形象和对女儿的殷切期盼。
2.词组类型
在不足一百个单词的第十一段中,介词词组就有七个,占单词数约30个,占到约整段的30%。其中,有四个是由with引导的作方式状语的介词词组。这些词组体现出Dee对待家人不甚关心,以自我为中心,不顾及他人感受,这也很形象地反映出她身上体现出的对黑人文化传统的反叛和对白人文化及生活的热切期盼和忘本式地追求。
三. 修辞方面
1. 明喻的大量使用
作者在整篇小说中使用了大量的明喻,其中大部分都是由like或as引导的,这也是对文章的叙述者――黑人母亲的文化程度的再次体现。在第十九段中有这样一句:“Hair is all over his head a foot long and hanging from his chin like a kinky mule tail”。这里是对Dee的男朋友的描述,说他的头满整个脑袋足足一英尺长,从他的下巴悬吊下来活像卷曲的骡子尾巴。明显,把头发比作骡子尾巴这个比方很古怪,可见母亲对女儿男友的形象并不满意。在第五段中有这样一句:“I can kill and clean a dog as mercilessly as a man”, 母亲把自己与男人作比,来凸显自己干活时的强悍和粗犷,她认为只有男人才能干那些很粗糙费劲的活儿,这体现了母亲潜意识里的性别差异观念。
2. 拟人的适当运用
拟人是指把物拟作人,使其具有人的外表、个性或情感的修辞手段。拟人可以通过形容词、动词或名词表现出来。第十三段有这样一个拟人句“Like good looks and money, quickness passed her by”.这里,赋予了长相,钱财和敏捷的思维以人的动作“pass by”,这样不仅使句子更加生动,达到诙谐幽默的效果。同时,也很好地流露出母亲对女儿Maggie心怀遗憾,在她看来,Maggie不如Dee那样迷人和聪明是因为运气不好,是老天对她不公。由此可见母亲看待事物的主观性,进一步体现了她的文化程度不高,不能客观地看待和分析事物。
四. 篇章语境方面
小说采用第一人称的叙述方式,从黑人母亲的角度展开叙述。第一人称的叙述方式不如第三人称的叙述角度那样客观,但是后者不及前者那样具有感染力。阅读过程中,读者很容易将自己主人公化,化身成为那位黑人母亲,因而能更深切地体会到黑人母亲对女儿的不解和失望,但同时又不甘于妥协,极力想改变女儿已形成的价值观。母亲和女儿之间的冲突仅仅是一个缩影,作者真正想反映的是非裔黑人在寻根文化、伤痛文化与现代白人文明的冲击与涤荡中的苦痛挣扎和文化身份认同,构拟出一幅在深沉厚重的历史文化遗产面前迷惘和抗争的画面。
中图分类号:G642.4 文献标志码:A 文章编号:1674-9324(2014)19-0179-02
文体学与计算机相结合产生了计量文体学,Leech和Short早就认为文体学需要统计这种定量分析来获得客观的分析结果,以支撑对文学语篇文体特征的主观判断(McEnery & Wilson,2006:117)。对文学语言特征的定量研究其实早在20世纪40年代就开始了。Enkvist也曾认定文体特征具有统计学原理。他认为文体标记在不同文本内出现的密度显著不同,这就是语言文体学被称为定量科学的原因(桂诗春,2005:133)。语料库是由从具有代表性的语言材料中随机抽样输入计算机的大量文本组成的。(杨惠中,2004)。Word Smith是一款计量文体学必备的、功能非常强大的语料库软件,由利物浦大学的Dr. Mike Scott开发,在计量文体学研究中发挥着重要作用。
计量文体学在文本分析中的应用及局限性如下:
1.判定作家文体风格。计量文体学基于语料库这方面的研究,量化出作品的词频、语序等,进而评定该作家的文体风格。例如,在研究Swift的散文时,就以Swift文章中联接词出现的频率与Addison、Johnson和Macaulay文章中联接词出现的频率加以比较:
Swift的文章使用联接词的频率最高,说明他的文章的逻辑性最强。那么“逻辑性”就是Swift这篇文章的文体特征(Milic,1991)。
Milic还对William Faulkner和Gertrude Stein作品中句子长度做了量化统计,发现Stein作品的平均句长是30个词,而Faulkner的平均句长达38个词,由此也可以比较出两人作品风格的差异(隋桂岚,2003)。
2.确定作品的作者身份。《红楼梦》前80回和后40回是否系曹雪芹一人所作,一直备受争议。研究人员将《红楼梦》前80回和后40回分别输入计算机,通过《红楼梦》前80回和后40回生成数据的对比、分析,最终判定《红楼梦》后40回非曹雪芹所作。又如,由于种种原因,起初无法判定《给一位年轻诗人的忠告信》作者的真实身份。研究人员将Swift与其他四位同时代作家作品中的语法结构进行量化对比,发现《给一位年轻诗人的忠告信》结构与Swift作品的结构特征相一致,最终判定该作品系Swift所作。
3.了解小说主题及情节发展。计量文体学通过使用Word Smith语料库检索软件中的wordlist和plotting功能对小说文本的情节进行统计分析。比如想了解小说《傲慢与偏见》的故事情节,首先可以通过对全篇小说keyword的总结,伊丽莎白和达西两人的名字在文中出现的频率最大,分别为596和374频次,由此可以得出小说的主人公是伊丽莎白和达西。另外,对于《傲慢与偏见》关键词的检索分析,对照作者自建语料库,可以做出《傲慢与偏见》的情节展示图,即所谓的plot mapping,可以更清晰地把握小说情节(王雁,2007)。
4.进行翻译研究。不同的译者有自己的翻译风格。通过计量文体分析,可以把握译文和译者的语言风格和模式,把握某种原语对译文模式的影响,以及不同译者对相似文本的不同处理风格(廖七一,2000)。想对比《红楼梦》霍译与杨译译文的学术性,文本分析软件自动将霍译译文分别与英语中的最常用2000词表和学术词表作对比,结果如下:①文本中分布的总词数=4357;②分布在最常用2000词表中的总词数=3622(83.13%);③分布在学术词表中的总词数=47(1.08%);④不属于述两个词表的总词数=688(15.79%)。而对杨译译本进行类似处理,得出的四项相关数据如下:①3602;②2952(81.95%);③29(0.81%);④62(17.24%)。由此,基本可以认为霍译译文比杨译译用词更学术化、更书面化(郑振隆,2009)。然而,迄今为止,计量文体学在文本分析中的应用还不太广泛,语料库的潜力尚未得到充分发挥,具体原因如下:①缺乏系统的研究。尽管计量文体学可以依据定量分析来以获得客观的分析结果,但现今这方面的研究人员偏少,对研究前景的探讨、方法论探讨缺乏系统化。②计量文体学现今的研究体裁比较单一。对小说体裁研究得多,而对散文、诗歌、戏剧、民间文学等其他文学体裁研究甚少。③对文本进行处理必须熟练掌握文本编码、文本分析软件等的使用,这一点也限制了一些研究者研究。④计量文体软件优势不是太明显,还有待于进一步开发,否则无法实现对文体的全方位、多角度的分析。
基于计量和统计的文体研究,使得文体研究和欣赏不仅仅局限于主观的理解,有助于人们更理性地分析文体作品。尽管计量文体学的进展还不尽如人意,但这正是我们探索和发现的空间。随着语料库技术的进步与计量文体软件的进一步开发,计量文体研究的优势势必将提升。随着人们对计量文体学的关注越来越高、研究体裁越来越广泛、研究方法越来越系统,计量文体学必将在文体研究中发挥重大的作用。
参考文献:
[1]McEnery,Tony & Andrew W.Corpus Linguistics.An Introduction[M].Edingburgh University Press,2006.
[2]Milic,L.Progress in stylistics:theory,statistics,computers[J].Computers and the Humanities,1991,(25):393-400.
[3]隋桂岚,孙利望.语料库、统计学与文体分析[J].辽宁工程技术大学学报(社会科学版),2003,(6).
[4]王雁.《傲慢与偏见》的语料库检索分析[J].江苏教育学院学报(社会科学版),2007,(2).
一旦进入徐的文本世界,我们就会发现其中满是孤独印痕的残缺。残缺成为作者笔下人物生命的一种存在状态,是他孤独体验的表现。同时,他的字里行间又有着对圆满的不离不弃。
一、残缺:文本与现实的留白
在徐的作品中,很明显的一个特点就是对残缺的表达。残缺,顾名思义,就是事物整体的不完全、不完满状态。其本质已在词源学上显示出它与完美的对立。“残缺成为作者笔下人物生命的一种存在状态,是他孤独体验的表现。从文本细读及情感体察的角度去解悟文本中充满残缺的孤独印痕,能更好地理解作者及文本的深刻思想内涵。”[1]《时与光》文本中,他对于残缺的表达很具有代表性,我们且以文本为例,剖析一下他的残缺表达。
1、生活信仰的缺失
① 随波逐流的生活状态。
《辞海》给出的“信仰”的定义是:“对某种宗教或主义极度信服和尊重,并以之为行动的准则。”[2]《时与光》中,主人公郑乃顿的生活是一种随波逐流的状态,他是个没有信仰的人。他自认为是个偶然论者,他随波逐流所以相信偶然。故事开始时他与陆美娜的结识,他去赴陆美娜的约会,完全是因为他没有事情做,正是在这种“闲”的生活状态下,对于陌生人陆美娜的闯入,他兴致勃勃的与之周旋,对于她的邀请也欣然赴约。正是因为他的随波逐流,他与陆美娜之间的感情介于朋友和情人之间,他甚至与陆美娜发生了肉体关系。正是他的随波逐流的心态,使他徘徊在林明默和罗素蕾之间犹豫不定,最后导致悲剧的发生。
② 猎艳与专情
在文中,郑乃顿是一个知识分子,他借住在萨第美娜太太家,对于林明默一见钟情,林明默的沉默与神秘深深的吸引着他,他无时无刻不思念着她,他的感情深沉热烈,从这个角度来看,郑乃顿是一个专一的男子,也是一个值得人爱的男子。但是,让人不解的是,他在深爱着林明默的同时,与陆美娜继续亲密的交往,并且在一天晚上与陆美娜发生了肉体关系。不可否认,陆美娜是美艳的女人,对于男人很有诱惑力,她的身边也有很多男人围着她转。但她不是,而是舞蹈家,郑乃顿在深爱着林明默的同时,跟一个女性朋友上了床,而他只归结为诱惑,只是在当时有点不安,而没有对于自己行为失控的内疚,这是他作为男人猎艳好色的一面。
2、家庭生活的缺失
在《时与光》中,我们略略注意一下就能发现,文中的人物大都缺少家庭生活,比如郑乃顿,他是孤身一人漂泊到香港,我们从文本中只能大概知道他是因为失恋来到香港,对于他的身份,我们并不明了,对于他的家人,对于他之前的职业生计问题都没有提过,对于以前的朋友,也从来没有联系过,就好像他凭空出现在香港,开始了一段新生活。萨第美娜太太,她是文中唯一一个有过家庭的人,可是我们看她的生活,住在一所大房子里,而在同一屋檐下的人,都不是她的家人,只是一些孤身的房客,她的唯一的女儿在国外定居,没有生活在她的身边。对于旁都和尤美达,他们两个是兄妹关系,但无论是他们各自生活还是聚在一起,他们都没有提过家人,好像是两个很独立的个体。还有多赛雷,苏雅,无一不是没有家人,独自生活。
3、职业生计的缺失
《时与光》文中的人物,除了没有家庭生活外,也很少写到他们的职业生计。如多赛雷,我们只知道他来自英国,而他究竟以什么为生,徐并没有交待。还有林明默,也一直没有写到她的职业,文中提到她住在萨第美娜太太家里,可见她没有自己的房子,她有自己的汽车,可见她有一份薪水不错的工作,通过分析我们也仅知道这些。苏雅父母双亡,靠在歌厅唱歌维持自己的生活,她认识了林明默以后脱离歌厅,开始跟着帕亭西教授学习声乐,她的生活来源是受林明默的资助,而林明默依靠一份什么职业来维持她和苏雅两个人不菲的开销,而且生活质量还比较上乘?这一直是一个疑问。另外的几个人物,郑乃顿是作家,陆眉娜是舞蹈家,旁都是导演,尤美达是编辑,剧作家,这几个人的职业,总是让人觉得他们的职业是为故事的情节发展而设计的。几个主要人物在角落待命,一旦故事情节需要,人物便准备随时为发展剧情而出场。也许是因为这个方面的交待有所欠缺,读徐的小说,总有一种编故事的感觉。
二、圆满:焦渴心灵的给养
在徐的作品中,除了残缺的表达比较突出之外,还有让人印象深刻的一点,那就是对圆满的言说。在他的作品中,爱情和友情在精神层面达到了圆满。他对于爱情和友情倾注了满腔的热情。
1、爱情:超脱世俗的纯精神之恋
对于爱情的描写,徐总是处理的很纯净,两性之间的爱情是纯精神之恋。在《精神病患者的悲歌》中,海兰和白蒂都深爱着“我”,而海兰为了成全白蒂,自己跳海自杀以成全他们两人,这种牺牲,不仅因为她对白蒂深深的友情,更是因为她对“我”的爱情。在《时与光》中,郑乃顿对林明默的爱情也是完全脱离世俗的纯精神之恋。他第一次遇见林明默,林明默正在音乐室听宗教音乐,林明默安静,神秘,他只看到了她的侧面便爱上了她。他最后不爱林明默,是她显出精明能干的一面以后,林明默的安静神秘消失了,郑乃顿对她的爱情也消失了。郑乃顿爱的不是林明默,而是与林明默爱情的距离。
2、友情:永恒的港湾
徐对于亲情的感受比较少,所以他对友情非常看重,在他的作品中对友情的描写也比较多,《时与光》对友情的肯定与歌颂浸透在字里行间。尤美达与郑乃顿之间的友情非常纯粹,无论在事业上还是生活上都互相帮助,没有任何功利目的。郑乃顿在尤美达地帮助下从初来香港时的漫无目的,最后找到了自己的职业和生活重心。多赛雷给予苏雅无私的帮助,使她在艰难的人生中看一丝曙光,让她重新有了活下去的勇气。当他得知苏雅爱上自己并且感情不能自拔的时侯,他和她相约三个月,如果苏雅没有找到人生寄托,他会放弃自己的修行,回来与她结婚。为了成全朋友的幸福而放弃自己的人生目标,这种牺牲让友情光芒万丈。
三、原因探究
一部作品总是与作家的个人生命体验息息相关,《时与光》中的圆满与残缺,与徐的个人经历有很大关系。我试着从以下几个方面来探究一下徐的经历与他的作品内涵之间的关系。
1、童年经历:孤独无依
徐的童年应该说是比较凄苦的,他的父母感情不合,父亲总是在外面找女人,在他五岁的时候,他被父亲送去寄宿读书,没有亲人的照顾与安抚,他的童年是比较缺少关爱的。另一方面,徐读书求学之路走得比较顺畅,不间断的从小学一直读到大学,从心理学改到哲学,而且还有机会去国外留学。少年孤寂与求学生涯,让他的个性敏感而又深刻,他的亲情需求一直处于不饱和的状态,所以对感情的需求转移到友情和爱情上面。他很依赖朋友,他曾经有过这样的经历,“他大学毕业,离开北平的时候,他的房子让给一位朋友住,他的书就存在房间里请朋友照顾,谁知过了一个暑假徐回去的时候,朋友竟把值钱的书都拿去卖了”[3]不过,“他仍旧视北平为自己的第二故乡,并把那里的朋友视为最好的精神寄托。”[4]
2、婚恋:欲说还休
在婚恋方面,徐的经历比较坎坷,他一生中经历三次婚姻。第一次与赵琏的婚姻,以对方的情变终结。第二次与葛福灿的婚姻,两个人的感情基础是比较好的。但是当时社会政治气氛紧张,在恐惧中徐只身一个远走香港,没有多久香港与大陆的大门关上了,他们的夫妻情分就此完结。相爱但是不能相守,婚姻带给徐的是又一次的遗憾与无奈。第三次与张选倩的婚姻,一直维持到他去世,只有第三次婚姻是稳定的,让他能够有一个最后的归宿。徐对婚姻的感受比常人要多些无奈的体验,对于婚姻的不确定感,让他对婚恋持悲观态度。《时与光》中,除了尤美达与何医生之间感情比较稳定外,其他人的爱情几乎没有圆满结局。郑乃顿与林明默、罗素蕾和鲁地之间,结局是两人死亡,一人沦为囚徒;旁都与陆眉娜,方逸傲之间的爱情,最终以陆眉娜终生残疾、方逸傲死亡而收场。
3、生活轨迹:漂泊动荡
徐的一生漂泊动荡,这种生活方式深深影响着他的人生观与世界观。普通人的生活,日常事务占了很大一部分,所以作品往往写实居多。而徐由于生活方式的漂泊不定,他的作品写实成份很少,情节离奇居多。比如《阿刺伯海的女神》中,男女主人公的爱情发生在大海上,从故事开始到结局,始终是缺少人间的烟火气息。《时与光》也是如此,故事发生的很偶然,郑乃顿没有目的的漂泊到香港,偶遇了陆美娜,然后才有了后面一系列的故事。郑乃顿是个偶然论者,他觉得一件极其偶然的事件,或是一个微不足道的因素,都可能因此让生活改变,这些都是受徐的生活状态影响的结果,他一生漂泊动荡,更增加了他对人对事的不确定感,郑乃顿的偶然论在某种程度上是徐的人生哲学。
总之,我们细读徐的文本,他对于残缺与圆满的表达情有独衷,这跟他的生命体验有关,他抒写的不仅仅是故事,更是他自己的人生。
参考文献:
[1]陈娟: 《一种说不出的残缺――论徐的孤独及小说创作》, 2006年硕士论文
[2]辞海》,上海辞书出版社, 2002年, 1898页
[3]吴义勤、王素霞:《我心彷徨徐传》,2009年上海三联书店,第36页
德国功能主义学派代表人物克里斯蒂安?诺德在其著作《翻译的文本分析模式:理论、方法及教学应用》中指出翻译过程中文本分析的必要性,并详细阐述了翻译导向的文本分析模式。该模式认为文本是一种“语言手段和非语言手段共同作用而实现的交际活动”。文本分析的过程是译者更深层次理解原文和译文关系,得出翻译策略的有效途径。对源语文本的分析可从文外因素和文内因素两方面着手,文外因素包括文本发送者、发送者意图、读者、媒介、交际时间、交际地点、交际动机和文本功能等;文内因素分为文本的题材、内容、前提、文本构成、词汇、句型结构和超语段特征等。
二、许译本《道德经》文本分析
全知式的视角呈现了时代背景为理解人物形象奠定了基础,旁观式的视角客观地描绘场景为读者留下了“不传”的想象空间。《断魂枪》是第三人称叙述,在第三人称的作品中,往往并非是以一种叙述视角贯穿全文,本文绝大篇幅是采用全知式的叙述视角。作者利用全知式叙述视角的全知全能功能,为我们充分的描述了时代的变迁与氛围。“东方的大梦没法子不醒了。炮声压下去马来与印度野林中的虎啸……江湖上的智慧与黑话,义气与声名,连沙子龙,他的武艺、事业,都梦似的变成昨夜的。”我们感受到了历史变迁的沧桑,同时也为沙子龙的“不传”埋下了伏笔。之所以“不传”,不是因为不想传,而是不知传给谁,面对在时代变迁里处处茫然的愚民,沙子龙究竟传给谁呢?还是将“五虎断魂枪”永远活在那个冷兵器时代吧!然而,作者并不单一地将这一视角一用到底,而是采用跳角(叙述者自由地运用不同的视角进行叙述)的方法。如:为了推动情节的发展,设置了王三胜摆场子这一段,如果沿用全知式的视角,无法客观地将事情的来龙去脉说清,(全知式往往会连人物的心理变化也能窥探)于是,转用旁观式的叙述视角,叙述者完全隐藏,而以第三人称的视角客观地叙述整个事件的全过程。在这一情节中,我们读者存在着很多的疑问,为什么沙子龙不和孙老者比试比试?为什么他不传那套枪法……这样的叙述视角留给我们许多思考的空间,让我带着好奇心去探究沙子龙的人物形象。
二、“烘云托月”的叙述技巧
“烘云托月”的手法为我们呈现了人物的形象,侧面烘托的描写使读者对沙子龙的武艺产生了无限的遐想。《金圣叹在评》中提出了“烘云托月之法”,是用侧面渲染以显示或突出主体。这篇小说的主人公是神枪沙子龙,而作者却给予他寥寥几句的正面描写“谁不晓得沙子龙是短瘦、利落、硬棒,两眼明得像霜夜的大星?”“只是在夜间,他把小院的门关好,熟悉熟悉他的‘五虎断魂枪’。”相反,我们从各色人对沙子龙的仰视中,了解到了他一身非凡的武艺,想象到当年的虎虎生威。正如《陌上桑》中的描写秦罗敷的美貌时,没有正面地描写罗敷,而是通过行人遇到罗敷的表现,从侧面烘托出了她的美貌。沙子龙的武艺与果敢也是在那些他不曾承认过的“徒弟”们的“吹腾”中得以体现。
三、“反”的情节设计
“反”的情节设置,使读者的阅读期待与现实形成了较大的落差,但与此同时激发我们思考沙子龙对“武”的理解。当王三胜在孙老者面前栽了跟头,想让“师傅”给出头,读者的好奇心也被调动到了最高点,十分期待神枪沙子龙的亮相,也迫不及待地想要目睹那套“五虎断魂枪”的庐山真面目。但是作者却荡开一笔,将沙子龙向孙老者赔礼的场面呈现在我们面前了。之前对沙子龙的仰视与现在拒绝比试,形成了巨大的心理落差。不少人会认为沙子龙不再是英雄好汉了,然而这却让我重新认识沙子龙心中的“武”。传统意义上的“武”是拥有一身的武功,遇到不平之事的拍案而起,但面对时代的变迁,沙子龙的“武侠”之气,已经内化为了精神气节。司马迁在《游侠列传》中曾说“今侠者,其行虽不轨于正义,然其言必信,其行必果”。沙子龙正是这样放弃了世俗的纷纷扰扰,将“武”的核心精神融入了自己的内心,不在以枪法论英雄成败,而是将习武之人的“言必信,行必果”传承下去。
中图分类号:G434 文献标识码:A 文章编号:1671-7503201307-0042-03
很多语文教师都遇到这样一个问题:学生的作文除了给写写评语之外,怎么样更科学地去测量呢?这样的问题很普遍,也非常重要。随着教师专业化发展的不断深入推进,一名好的语文教师不能仅仅会教书,更重要的是能将自己的教学实践与研究结合起来,形成指导语文教学实践的普遍规律。本文介绍的重复测量方法就是教语文教师如何科学地测量学生作文从而形成研究结论。
重复测量研究用来分析一段时间或某几个时间点个体的增长趋势或个体之间的差异1,主要采用重复测量的多元方差分析对数值进行统计并对结果进行解释说明。所谓打写是指小学生在计算机或某种手持设备的支持下使用键盘进行输入的一种写作方式。以往类似的文本分析研究,大都采用均值说明学生打写规律的变化趋势。这种表示过于粗枝大叶2,同时也不合适描述个体特征的发展,在实际的操作中显得过于松弛。在寒暑假后,学生的打写状态一般都会由于疏于训练而变得不稳定;在每个学期的开校前两周、期中考试周、期末考试周这三个时间段内,学生的打写水平也有可能受到各种各样因素的干扰而呈现出意料不到的波动,这些影响因素如果只用平均数去表示就有失严谨了。在语料收集中避开上述特殊时间段并选取学生打写能力相对平稳的时间点进行测量可以使研究结果更加可信和有效。通过求出多次测量之间的差值并计算出差值的多元方差以及通过正交转换之后的趋势分析,有利于在相对较长时间的动态发展中对学生打写规律进行准确和连续刻画。重复测量方法在学生打写文本分析中的应用应特别注意以下几个方面。
一、语料的选样
班级案例语料是重复测量研究中常用的语料形式。这种形式的语料可以将一个班级作为个案,选择学生较为熟悉且大家集体参与的活动进行主题打写产生语料,有效避免因为生活经历以及地区的差异而带来的研究误差。选择这种形式的语料有两个考虑:一是在不打乱正常教学秩序的前提下,很难通过班级对比实验设计来产生语料,有效的实验和可信的统计之间确实存在着难以两头兼顾的困难3;二是对于打写测试,学生生活圈子非常有限,他们看待事物的态度以及观点表述和成人有着明显的区别,知道的就能写出来,不知道就是不知道。对于一些写作主题由于地方差异,很难达到统一。比如“雪”这个主题,北方的学生写起来津津有味,而南方有的学生从小到大根本没有见到过雪,根本不知道雪意味着什么,只是从电视或书本上了解过。
在研究中为什么不采用抽样的办法来收集语料而偏偏选择班级案例法呢?这是因为对于学生写作文本这样的语料对象而言,抽样和班级案例法有着本质的区别。抽样是部分代表总体,通过研究局部推断总体状况45。但是对于个体的打写测量能否使用抽样的方法生成语料呢?综合以往的研究,打写话题中字词的识别、对话题意义的理解、打字的速度、打写话题的熟悉度、打写测试的时间、打写过程中指导与提示以及工作记忆等这些内部因素会影响学生的打写,教师的教学风格、教师和学生之间的亲密程度、学校对写作的重视程度、学校之间的差异、地区之间的差异、家庭氛围和文化素养之间的差异、父母的文化水平等这些外部因素同样对学生的打写有着影响。试想,如果将这样纷繁复杂因素影响下的学生打写采取抽样的方式进行研究,最后得出的只能是一般化的“学术”结论,而对学生个体实际的能力培养起不到应有的作用,一般化的结果对教师而言很可能成为束缚他们自己的统计紧箍咒6。而对于班级案例研究而言,在自然状态下对特定的同一个班级进行长期追踪,收集不同时间点的语料进行深入细致分析。由于这个班级在追踪过程中始终是同一个教师、同样版本的教材、相同的教学模式,受到的外界变量干扰较少,所以,对于研究学生的打写有着得天独厚的优势。
二、语料的生成过程
什么样的测试方法生成的语料才能真实反映学生的打写水平呢?一般而言,打写测试方法可以分为一次测试和重复测试。所谓一次测试是指对全部被试进行一次测试后计算组间差异或前后测差异;所谓多次测试是指通过对全部被试进行一段时间或长时间的跟踪后进行同一内容或不同内容的多次测试,以保证测试的准确性。学生打写的内在差异具有动态变化的属性,单凭一次测试可能很难反映他们打写的特点,也不足以说明学生写出这样或那样内容的真实意图以及实际的写作潜能,多次测试甚至是长时间的追踪测试对于学生打写测量是必要的。
同一个班级的学生在不同时间点打写同一个话题的重复测试的语料生成方式,既能够准确地测量学生在不同时间点中语言运用能力发展的动态状况,而且能够排除一些其他因素(如不同话题之间的干扰、教学水平因素、教师自身因素)的影响,对打写的可信度起到很好的支持作用。打写测试时间的安排应避开寒暑假、节假日以及期中期末考试三个时间段。打写测试以第一次打写内容为基础,后续打写都在第一次测试的基础上进行续写或修改。有的学生因为和其他学生有点小摩擦,不再愿意写第一次写作中出现的学生,这样也是允许的。
三、打写话题的筛选原则
打写话题一般可以分为多话题测试和单一话题测试。多话题测试不可控因素过多,实施起来较为困难;采用同一个话题对被试进行多次测试的方式,与认知神经科学中领域特异化知识系统的研究成果更加贴近。为了尽量达到话题熟悉度的要求,在选择话题的过程中需要遵循四大原则:第一,话题具有延续性而不能是瞬时性的。所选话题应该是和学生的生活实际紧密相连并且能够让儿童经常参与的活动或事件,而且能够考虑不同区域的学生都能进行打写的共性特点;第二,话题具有丰富性而不能是单一的。所选话题的内容既要具有阶段性的稳定性,又要具有细节内容的变化,不管如何,这些丰富的变化是让学生能够切身体会到、感触到的;第三,话题具有集体性而不能是个体的活动。选取集体性的活动或事件作为话题就会避免一部分学生因没有话题而生搬硬套的情况;第四,话题须具有真情实感,将学生本身对生活的情感融入进去,用语言表达心声,表达自己对周围事物的认识和看法,这一条是四个原则之中最为关键也是最为核心的一条。
四、语料的预处理
由于年龄、要求以及打写的特殊性,学生打写的文本和一般交互性会话文本的处理方式有很大的不同之处,具体处理方式如下。
第一,词的定义。词的定义以2008年国家语言文字工作委员会的《现代汉语常用词表》(草案)为依据。该草案共收录使用频率较高的汉语普通话常用词56008个,主要以单音节词(3181个)和双音节词(40351个)为主,也收录了一些熟语和表达概念名称的其他固定短语7。在实际的文本电子词库中有词汇56064个,比标准多出了56个,这56个词组皆为词表一些词的同音词,如词表中是年轻,在电子词库中“年轻”和“年青”则是两个词,他们的频率号相同,都是697。值得特别注意的是,学生在打写的初期经常出现词语误打错误、音节替代现象以及乱打三类现象。
对于乱打这一类现象,处理时直接将胡乱打写的字符剔除就行。对于词语误(错)打和音节替代的现象:词语误(错)打时,误(错)打的词语在词语统计中不计算;利用音节替代的词语,在统计中也不计算;如果音节书写错误,就按照错误的词语进行剔除。
第二,分词处理使用中科院计算所汉语词法分析系统ICTCLAS,这个系统的中文分词、词性标注以及未登录词识别三大功能恰好能够解决学生打写中出现的词项频率、实词和虚词以及不经常使用的一些新词的分词问题。
第三,人名和事物名称、地名在文本预处理中视为非禁用词,计入词汇数量统计。
第四,别词、多余的词项、错用词、文不对题的部分都不计入词汇数量统计。
第五,句子处理:语文新课标规定,二年级结束后才要求使用逗号和句号。所以,对于刚入学的儿童而言,打写中利用逗号和句号区分出句子是非常困难的。对于文本中的句子,采用人工增加逗号和句号后再进行切分的办法来处理儿童打写文本中的句子。
第六,命题的计算:句子的判别主要依靠人工方式进行,一般判别以句号为准则,但是对于一些感叹句表达判断和双重否同表达判断的句子,也被归属为命题。
第七,完成全部多轮打写测试的文本才是有效文本,才能进行计算。
五、语料分析的五种参数
第一,总体特征:每轮打写的总体特征,这些特征包括人数、最小值、最大值、平均值和标准差,这些总体特征包括毛词汇量、净词汇量、IR分布度等。
第二,差值特征:后一次打写测试的总体数量减去第一次打写测试的总体数量,这些特征包括人数、最小值、最大值、平均值和标准差。
第三,多元方差分析:检验多次打写测试的总体特征、差值特征之间的均值差异是否显著,需要表述清楚F值和P值。
第四,单因变量检验分析:进一步观测单因变量检验结果,检验多次测试的均值是否存在着显著的差异性。
第五,趋势分析:经过矩阵转换,找出不同测量次数的正交多项式线性、二次和三次系数,计算出三个正交转换后的变量Lin、Qua和Cub。分别以正交转换之后的三个新构成变量为因变量进行多元方差分析,检验总体多元方差是否与差异变量Wilks’Lambda整体多元方差统计结果一致并说明单因变量分析的线性和二次、三次增长趋势是否显著。
实际上,对于语文教师而言,掌握重复测量方法是非常容易的,关键在于教师能不能坚持规范的测量方法,能不能将学生长期打写的数据保存下来。我们期望在学生打写研究中能够出现更多更为实用的研究方法,这对研究学生打写规律以及知识建构规律都是有帮助的。
参考文献
1刘红云.追踪数据分析方法及其应用M.北京教育科学出版社20051.
236 徐晓东.从组间比较到个体内比较的回归重构教育技术学研究方法论J.电化教育研究2009146-53.
中图分类号:H36 文献标识码:A
Japanese Third Person Pronoun "彼/彼女" Text Analysis
HE Wenjing
(The Applied Foreign Language Department, Guangdong College
of Industry and Commerce, Guangzhou, Guangdong 510510)
Abstract In this paper, "ノルウェイの森" (Kodansha library), "Golden Temple" (trendy library), "五体不足" (Kodansha) text analysis object, drawing Xu 1990 among the pronoun "he / she" investigate methods for Chinese third person, attempt to Japanese third person pronoun "he / Binv" in the text usage metering of investigation, analysis from two aspects: one, the third person pronoun "彼/彼女" linear structural analysis, second and third person pronouns "彼/彼女" hierarchy analysis.
Key words linear structure; continuity; hierarchy; pronouns unit
关于日语第三人称代词“彼/彼女”,迄今为止学界多从会话的角度进行了相关探讨,并取得了相当的研究成果。而对于第三人称代词“彼/彼女”在篇章中的使用情况进行的考察,据笔者了解数量不是太多,且探讨尚欠深入与全面,因而笔者认为从篇章角度对第三人称代词“彼/彼女”的研究还有待进一步的深化。
本文将以『ノルウェイの森(社文)、『金寺(新潮文)、『五体不足(社)为文本分析对象,借鉴徐1990当中对中文第三人称代词“他/她”的考察方法,尝试对日语第三人称代词“彼/彼女”在文本中的使用情况进行计量性的考察,分析从两个方面展开:(1)第三人称代词“彼/彼女”的线性结构分析,(2)第三人称代词“彼/彼女”的层次结构分析。
1 第三人称代词“彼/彼女”的线性结构分析
文本中,当一个人物第一次被引进篇章时,一般以名词或名词短语的形态出现,下文这个人物若再次出现时,往往以代名词或零形式来指示。
(1)そして直子にするがの中で薄らいでいけばいくほど、はより深く彼女を理解することができるようになったと思う。
――『ノルウェイの森(上)
(2)「ごめんなさいと直子は言っての腕をやさしく握った。そして0何度か首を振った。
――『ノルウェイの森(上)
例句(1)、(2)中的“直子”为名词指示,“彼女”为代词指示,“0”为零形式指示。援用山梨1992里“照应”的理论,上下行文中,上下文所指称事项为同一事物时,前后文即构成“照应关系”,上文的指称为“先行词”,相对应的下文指称为“照应词”。(1)、(2)句中“直子”为“先行词“,“彼女”、 “0”为“照应词”。
1.1 “彼/彼女”与名词指称的语序
山梨1992把先行词与照应词的关系划分为“前方照应(anaphora)”和“后方照应(cataphora)”。先行词先于照应词出现称之为“前方照应”,反之,照应词位于先行词之前,为“后方照应”。
(3)直子は立ちどまった。も立ちどまった。彼女は手をの肩にあてて正面から、の目をじっとのぞきこんだ。
――『ノルウェイの森(上)
(4)の外に出ると、彼女はどこに行くとも言わずにさっさときはじめた。は仕方なくその後を追うようにいた。直子とのあいだには常に一メトルほどの距があいていた。
――『ノルウェイの森(上)
上例(3)中先行词“直子”位于照应词“彼女”之前,即为“前方照应”。例(4)中的先行词“直子”位于照应词“彼女”之后,属于“后方照应”。
1.2 “彼/彼女”的格分布
句法上来说,“彼/彼女”在句中通常充当三种成分,主格、所有格和目的格。经过资料分析可以看出,“彼/彼女”在不同格位置上出现的频率有不同。统计结果见表1:
统计结果可以看出,所有格所占比例最高,主格其次,目的格在701个例子当中仅发现了60例。
表1 「彼/彼女の格分布表
1.3 “彼/彼女”与“话题延续性(continuity)”
话题研究中有关话题的延续是被探讨的焦点。Givon(1983)把“话题的延续性”进行了三分类:主题延续性(thematic continuity)、行为延续性(action continuity)、话题/参与者延续性(topic/participant continuity)。本文将对第三种延续性进行讨论。
Givon(1983)中提出回数法(lookback),测量指称距离。“回数”指往回数小句。语篇中遇到“彼/彼女”,从“彼/彼女”所在的小句往回数(该小句不计算在内),一直数到另一个包含同一所指的“彼/彼女” 或同一所指的名词为止。同一所指的两个小句之间相间隔的句子数量称为“值(value)”,“彼/彼女”称为“实例token”。“值”的总数除以实例的总数,得到一个平均值(average value)。“值”的多少反映出延续性的强弱:“值”越大延续性越弱;反之,“值”越小,延续性越强。
(5)川の住んでいた世界が明るい感情や善意に溢れていたとしても、彼1は解や甘い判断によってそこに住んだのではなかったと断言できる。彼2のこの世のものならぬ明るい心は、一つの力、一つのい柔さで打ちされ、それがそのまま彼3のの法なのであった。私の暗い感情をいちいち明るい感情に翻してくれた彼4のやり方には、何かに正なものがあった。その明るさは私の暗さとあまりに隅々まで照し、あまりにな比を示していたので、折川は私の心を如にしたことがあるのではないかと疑われた。そうではなかった!彼5の世界の明るさは、でもあり偏でもあって、それ自体のな体系が出来上り、その精密さはの精密さに殆んど近づいていたのかもしれない。この若者の不な肉体の力が、えずそれを支えてしていなかったら、忽ちにしてその明るい透明な世界は瓦解していたのかもしれないのだ。彼6はまっしぐら走っていた。そしてトラックがその肉体をいたのである。
――『金寺
例(5)当中,代词“彼1”和名词“川”所指为同一对象,两者间隔一个小句,值(value)为1。“彼2”和“彼1”所指相同,两者之间也间隔一个小句,值也为1。代词“彼”与名词“川”即为“实例”。上例中实例共计6个,值为15,平均值即为2.5。
按照以上方法,将资料中包含“彼/彼女”的例句加以分析,得出如下结果(见表2):
表2 三人称代词“彼/彼女”延续性强弱统计表
同理将名词和零形式指称延续性强弱统计结果如表3:
表3 名词和零形式延续性强弱统计表
表2、表3相比较,我们可以看出,平均值最大为名词,9.01。居中为“彼/彼女”,4.09。零形式平均值为1.31,三者中最小。从而,我们可以得出结论,三种指称形式中,零形式的延续性最强,名词的延续性最弱,代词延续性居中。文本阅读里,名词的出现往往易于使人与具体实在的意象相关联,因此,即便拉长名词与其他同一指称的距离,也并不影响句意的解读,从而,延续性的话题里,名词的延续性最弱。而代词只包含性别、单复数概念,因而,延续性要强于名词。零形式指称最不易于现实物象相关联,所以延续性最强。
在第一部分里,试从篇章线性排列的角度,对第三人称代词“彼/彼女”进行了语序列、格分布以及话题延续性的分析,考察得出如下结论。
① 从篇章看,“彼/彼女”在不同格的位置上出现的频率是不同的。
② 代词的性质和名词相近,和零形式的性质相差较远。
2 第三人称代词“彼/彼女”的层次结构分析
2.1 “彼/彼女”与名词的层次关系
语篇当中,名词与现实中的具体意象相关联,而代词“彼/彼女”则起到提到替代名词称谓的作用。因而,我们可以说,对于现实意象的称谓,名词是第一位,而代词“彼/彼女”是第二位的。
上文论述延续性之强弱体现了名词和代词“彼/彼女”在语篇中控制范围大小,即小句数目的多少。延续性越强,控制范围越大;延续性越弱,控制范围则越强。延续性名词最小,而平均值最大,为9.01,则平均控制9个小句。“彼/彼女”平均值为4.09,则平均控制4个小句。这可以说明,名词的控制范围明显大于代词“彼/彼女”,处于高一级层次。
从所收集的材料来看,语篇中,包含主题的段落和句子往往主题人物首次露面会以名词的形式出现。从统计来看,主题段落中主题以名词形式首次登场的占所有例子的100%,主题句中主题首次登场以名词形式出现的占80%,代词“彼/彼女”仅占20%。
综合以上三点,我们不难看出,语篇中名词较代词“彼/彼女”而言,处于较高一级层次。如图1所示:
图1 代词与名词的层次构造图
2.2 一个“代词单位”中“彼/彼女”的分布情况
所谓 “代词单位”,指语篇中一个名词出现之后,会继续出现同指的代词“彼/彼女”,直到下个同指的名词出现为止,这个名词和同指的代词“彼/彼女”就构成一个代词单位。
本文主要分析德国“2005年联邦职业教育法”法本。该法本曾在2007年4月1日作过修订,具体情况将在后文交代。2005年法本主要包括总则、职业教育、职业教育的组织、职业教育研究规划与统计、联邦职业教育研究所、处罚规则、过渡条款与结尾条款共7部分105 条内容,主要法律框架前后变化见表1。
主要特点
立法中注重保护受教育者尤其是弱势群体的利益
德国2005年联邦职业教育法第二部分的第二节内容,专门针对教育关系的确立进行了规定。第10条第1款规定教育企业“招收他人接受职业教育,须与受教育者签署职业教育合同”。第 11 条第 1 款规定“合同应至少包含:1)职业教育的形式、内容和时间安排及职业教育目标,特别是教育应针对 的职业活动;2)职业教育的开始时间和期限;3)教育机构外的教育措施;4)每天的正常教育时间;5)试用期限;6)报酬支付与金额;7)休假期限;8)解除职业教育合同的条件”。在本法第四章专门针对特殊人群的职业教育进行了规定。 其中第一节残障人职业教育第65条第1款规定“应考虑残障人的特殊情况,特别是教育的时间和内容安排、考试时限、许可的辅助工具及要求第三者提供帮助,如对听觉障碍者提供手语翻译”。
立法重在解决实际问题
德国职业教育立法、修法主要用于解决本国职业教育及社会的现实问题。无论是联邦的职业教育法律还是州的职业教育法律,在涉及立法问题时,首先考虑的是这部法律的颁布能否解决目前职业教育所面临的某个具体问题,针对性特别强。
比如德国2007 年对2005年联邦职业教育法的修订主要是为了解决职业教育发展和决策中所遇到的技术问题。此前,德国联邦统计局和各州统计局对职业教育统计数据的处理,采用的是1991 ~ 1992 年开发的电子数据处理软件,由于技术的老化,已不能满足海量数据处理的需要。为此,在职业教育数据统计的新方案中,采用发展迅速且卓有成效的现代化数据处理技术,是大势所趋。到2007 年,德国政府所有官方数据处理软件已全部由现代数据处理软件取代。而作为德国职业教育发展重要依据的职业教育的数据统计,也必须应用最现代化的技术,去开发新软件,编制新文件,使用新程序。但是,技术升级会带来职业教育数据统计方法的改动,也会为数据的综合应用提供新的空间。根据德国法律规定,这些必须在一个国家认可的法律框架下进行。
通过详尽的条款规定保证法本的实施
德国职业教育法案,不仅包含指导性的原则规定,而且包含具体实施的详尽条款,包括要解决的问题、要达到的目标、需采取的措施、款项的数额等。条款规定得十分明确具体,文字表述严格、逻辑性强,不容易产生歧义,便于实施。这种条款的详尽性使立法具有明显的可操作性。
比如在2005 年版的第17条获得报酬权利的第1款规定教育提供者应为受教育者提供适当报酬。报酬金额根据受教育者年龄确定并随着职前教育的继续至少每年予以提高。第2款实物报酬可按社会福利法典第四部第17条第1款第1句第4点确定的实物计价值计算额度,但不得超过受教育者报酬总额的75%。第18条报酬计算与支付日期第1款报酬按月计算规定按天计算报酬时每月以30天计。第2款“每日历月的报酬应最晚在当月最后一 个工作日支付”。“职业教育关系自试用期开始确立。第20条试用期须至少1个月,至多4个月。”
新的立法以原有法本为重要修订基础
1969年德国产生了世界上独一无二的法律《职业教育法》。它是雇主、工会、行业协会和国家部门共同参与制定的,以实现多数人能够获得职业培训和资格为目标的法律。德国2005年联邦职业教育法就是将1969年颁布的职业教育的基本法《联邦职业教育法》与1981年颁布的职业教育的配套法《联邦职业教育促进法》合并,在此基础上加以修订而成。2007年的法本修订又是在2005年基础上进行。
启 示
在内容上要突出立法的针对性
职业教育法是针对职业教育的法律,在内容上必然要有特别强的针对性。我国现行1996年《职业教育法》的第一条为:“为了实施科教兴国战略,发展职业教育,提高劳动者素质,促进社会主义现代化建设,根据教育法和劳动法,制定本法。”这与现行我国教育法中“发展教育事业,促进社会主义建设”的目的相似,自身的独立性体现得不够。类似之处还有很多。建议在职业教育法的修订中,要借鉴德国做法,体现出职业教育的独特价值和突出特色,采用更具针对性的表达,明确职业教育利益相关方的义务与权利,明确职业教育法的行政执法主体和法律责任。
在表述上要体现立法的可操性
与德国职业教育法相比,我国的现行职教法共5章40条,其体例过于宏观与笼统。从立法技术上看,职教法原则性条文多,规范性和可操作性条文少。如立法语言中使用“应当、可以、鼓励、酌情”等笼统含糊的词语,造成法律本身可操作性、约束力、规范性不够。所以,在修订中应着力提高语言表述的严谨性和确定性,增强职教法的可操作性。在逻辑结构上,德国的法律包括假定、处理、法律后果和奖惩,我国也应该借鉴这一点,加强法律后果的表述,增加罚则条款。
阅读下面的文章,完成15~17题。
笑的价值
[英] 伍尔芙
(1)有一些事物,是在语言之外却又不亚于语言的,笑,便是其中之一。因为,笑尽管没有言辞,却是除人以外任何动物都发不出来的。一只狗,躺卧在炉前地毯上,因痛哭而呜咽,或因欢乐而吠叫,我们自会明白它的意思,而不觉有什么怪异之处。然而,假如它放声大笑呢?假如,当你走进房间,它不是摇尾吐舌,表示见到你时的欢愉,而是发出一串咯咯的笑声——咧着大嘴笑——笑得浑身直哆嗦,显出极度开心的种种神态呢?那样,你的反应一定是惊惧和恐怖。笑,似乎主要是而且纯然是属于人的。
(2)笑因何而起,我们几乎莫名其妙,它何时发生,也难以说清。幽默是顶峰,只有最罕见的才智才能登上塔尖,鸟瞰整个人生的全景。喜剧则徜徉于大街小巷,反映着琐细的偶发的事件——它那面明察秋毫的小镜子,映照出在它前面走过的人们身上无伤大雅的瑕疵和怪癖。笑,比其他任何东西都更能帮助我们保持平衡感;它时时都在提醒着:我们不过是人,而人,既不会是完美的英雄,也不会是十足的恶棍。一旦我们忘却了笑,看人看事就会不成比例,失去现实感。
(3)要做到能够嘲笑一个人,你首先必须就他的本来面目来看他。财富、地位、学识等一切身外之物,都不过是表面的积累,切不可让它们磨钝喜剧精神的利刃。孩子们往往比成年人更具识人的慧眼,妇女对人的性格则常常具有锐利的洞察力。可见,妇女和儿童是喜剧精神的主要执行官。这是因为,他们的眼睛没有被学识的云翳所遮蔽,他们的大脑也没有因塞满书本理论而僵死,因而人和事依旧保存着原有的清晰轮廓。我们现代生活中所有那些生长过速的丑恶的赘疣,那些华而不实的矫饰,世俗因袭的正统,枯燥乏味的虚套,最害怕的就是笑的闪光,它有如闪电,灼得它们干瘪蜷缩起来,露出了光森森的骨骸。正因为孩子们的笑具有这样的特性,那些自惭虚伪的人才惧怕孩子;或许也正是由于同样的原因,在以学识见长的行当里,妇女们才遭人白眼相待。她们之所以危险,是因为她们会嘲笑,就像安徒生童话中那个孩子,当长辈们都朝着国王那件并不存在的辉煌袍服顶礼膜拜时,他却直说国王是光着身子的。
(4)我们热衷于参加葬礼,探望病人,远胜于参加婚礼和喜庆;我们头脑中总摆脱不掉一个老观念,认为眼泪里含有某种美德,而黑色是最相宜的服色。
(5)真的,没有什么比笑更难做到,也没有什么比笑更可贵的了。
(杨静远译,有删改)
15.文章中“笑的价值”包含哪些内容?请简要概括。(6分)
第15题属于内容的概括与提取。这一题与2011年的第16题第一问“文中的例证分别揭示了‘捧’的什么后果?”相类似。“笑的价值”包含哪些内容?
参考答案:笑可以使人与动物相区别;笑可以帮助我们保持平衡感;笑可以揭示人的本来面目。“笑的价值”主要表现在第一段和第二段中,第三段也有涉及,但都被第二段内容覆盖了,要注意的是“笑”的两种表现形式——幽默与喜剧——以及它们各自的作用,也就是“笑的作用”。答案中的第二点最容易找出来,是文中的原词,而第一点和第三点都需要概括,第一点的提取区域为第一段全部,最主要的提示性信息集中在第一段的开头和结尾。第三点的提取区域在第二段的最后(它时时都在提醒着:我们不过是人,而人,既不会是完美的英雄,也不会是十足的恶棍。一旦我们忘却了笑,看人看事就会不成比例,失去现实感)。从“参考答案”可以看出,学会概括非常重要。
16.请简要分析文章第三段的论述层次。(6分)
第16题考了层次分析。2011年的第15题,2010年的第16题都是考论述的层次的,前两年考的是全文的论述思路,2012年考的则是指定段落(第三段)的论述思路,相对比较容易。一个段落的内容比较集中,但是在概括上增加了些难度。
参考答案:首先提出就本来面目看人是嘲笑的前提;接着阐述妇女和儿童能看清人的本来面目的原因;最后阐述妇女和儿童的嘲笑具有令人惧怕的力量。需要注意的是,第二点与第三点很容易被糅合在一起。
【摘要】网络是旅游者获取旅游目的地信息的重要途径。通过旅游者共享的网络文本,运用数据挖掘手段可以得到旅游者感知的目的地形象与特征。以旅游者分享的网络文本为研究样本,利用ROST Content Mining软件提取武夷山旅游形象的高频特征词,并借助UCINET软件进行高频特征词语义分析,进而提出旅游者感知最深刻的武夷山旅游形象;对负面评论进行归纳提炼,提取武夷山负面旅游形象,并提出针对性的优化策略,为武夷山旅游形象的完善和提升提供了依据。
关键词 旅游形象;武夷山;网络文本;内容分析法
一、引言
网络既是旅游信息来源,也是旅游感受、评价的交流平台。由于博客、主题帖、微博、游记、网络评论等网络文本交流形式包含大量旅游过程信息[1],因此旅游者多数通过查询网络文本来获取旅游地信息,并由此形成对旅游地的第一印象。许多学者尝试将网络数据用于旅游研究,其中,网络文本成为主要研究对象。国外学者通过网络文章的旅游形象传播问题,如Andsager、Echfier、Echtner、Reilly、Tapachai等[2-6]以网络文本为研究数据,运用内容分析法研究旅游目的地形象,并把网络文本中的高频特征词用作衡量旅游目的地形象的重要指标。
近年来,国内学者也开始依据旅游者共享的网络文本来进行相关研究,其研究内容主要集中在以下几个方面:(1)旅游形象传播研究:杨杨[7](2013)利用高频特征词统计、语义网络分析等方法研究两岸妈祖文化网络传播的差异;王亚奇[8](2013)则利用内容分析法对旅游者网络文本进行高频特征词分析以此来获取旅游形象传播过程中的旅游者感知。(2)旅游者满意度研究:朱峰[9](2006)等以艺龙网的网友评论为研究样本,研究旅游者对饭店服务质量的偏好与评价;李龙梅[10]等(2011)以游客网络点评为样本,利用模糊综合评价法对旅游者满意度进行综合评价研究;肖雪[11](2012)提出饭店网络口碑会对顾客价值产生影响,并利用多元统计方法分析顾客满意度的相关影响因素。(3)旅游者行为研究:赵振斌[12]等(2011)从背包客的网络游记入手,研究其旅游行为特征;肖安明[13](2012)通过研究旅游者对在线点评信任的影响因素来研究旅游者购买行为的影响;
积极的旅游目的地形象感知有助于提升旅游者对目的地满意度和忠诚度[14],良好的目的地形象有利于提高游客的重游率[15];旅游目的地形象对旅游者的消费决策产生影响,它成为目的地营销的重要内容[16]。基于此,本文尝试利用内容分析法,借助ROST Content Mining软件、UCINET软件对旅游者的网络文本进行分析,提取旅游者综合感知的武夷山旅游形象,为旅游目的地发展提出针对性建议。
二、案例地选取与数据获取
(一)案例地简介
武夷山作为国家级风景名胜区、国家5A级景区,自然与文化双遗产地,素有“奇秀甲东南”之称。在国内外享有极高的声誉。武夷山风景名胜区兼有黄山之奇,桂林之秀、泰山之雄,但是游客接待量却都不如这些景区(2011年黄山、桂林、泰山的游客接待量分别为274万人次、330万人次、459万人次[17])。与此同时,互联网上存在大量与武夷山旅游相关的网络文本,便于从中分析旅游者对武夷山旅游形象的感知,以探究提升武夷山旅游形象和吸引力的途径。因此文章选取武夷山风景区作为研究对象。
(二)数据获取
文章通过以下几种途径收集研究资料、数据:百度、Google等知名搜索引擎;携程网、驴妈妈旅游网、游多多旅游网、到到旅游网、大众点评网、同程网等旅游门户网站;新浪网、新华网等知名网站旅游频道以及武夷山吧等旅游虚拟社区。经过筛选,共得到1662条网友点评,其中好评1473条,好评率88.63 %(见表1),共搜集到189条负面评论。
三、武夷山景区旅游形象探讨
(一)武夷山景区形象高频特征词分析
使用ROST Content Mining内容挖掘软件提取的描述武夷山旅游形象的36个高频特征词(频次出现在前36位),详见表2。
首先,分析高频特征词的词性。高频特征词以名词、形容词和动词为主,名词主要是旅游地、景点、旅游环境、旅游产品等事物,有28个,数量最多,占总数的77.8%;形容词主要反映武夷山环境氛围、景观风貌和游后感受等旅游形象特征,共4个,占11.1%;动词表现了游客在武夷山的旅游活动和重游意愿,如在九曲溪进行“漂流”,对于天游峰、虎啸岩等进行“爬山”活动。对于重游这一想法,很多旅游者明确表示会“再去”或者是“有机会还会去”。
第二,从频率最高的10个特征词来看,“武夷山”作为全国著名的风景名胜区素有"奇秀甲东南"之称,兼有黄山之奇、桂林之秀、西湖之美、泰山之雄,是旅游者提及最多的词汇。“漂流”体现了武夷山的最著名的旅游体验活动之一,很多旅游者都是慕名而来。排名第3的“九曲溪”是旅游者进行漂流的场所,是武夷山的精华所在。位列第4的“风景”展现了武夷山是以风景优美、山清水秀著称,入选联合国自然与文化双遗产是对其优美风景的最佳肯定。排名第5的特征词是“好地方”,“好地方”多为旅游者在感受和深度体验了武夷山整个度假区之后的综合评价,体现了旅游者对整个旅游活动的满意以及对武夷山的喜爱。排名第6的特征词是“竹筏”,是进行漂流活动的必备工具,竹筏的高频出现一定程度上反应了旅游者对于“漂流”这一旅游活动的喜爱与印象深刻。“漂亮”作为排名最高的形容词排在高频词汇的第7位,这一形容词显然是对武夷山秀丽风景的高度评价,也是吸引广大旅游者的主要因素。“茶”排名第8,是武夷山最重要的旅游购物产品,茶也是武夷山的一页旅游名片,是武夷山人的文化底蕴所在。而“值得”作为高频特征词中唯一的副词排名第9,这显而易见地表现了旅游者对于武夷山之旅的满意,很大程度上体现了游客感知的旅游价值和旅游质量。排名第十的是“景区”,景区这一词是武夷山多个景点、多项旅游活动的综合,体现了整个旅游过程中行程的丰富性。
第三,根据高频特征词总体情况,将武夷山旅游形象归纳为三大主题:(1)优美的风景和旅游景点(武夷山、九曲溪、风景、好地方、景区、大红袍、山水、天游峰、景点、山清水秀、一线天、丹霞地貌、大王峰);(2)独特的人文环境与自然环境(空气、自然、夏天、文化、遗产);(3)丰富的游客体验和高度的游客满意(旅游、漂流、竹筏、茶、印象大红袍、爬山、导游、服务、艄公、漂亮、山清水秀、值得、好玩、难忘、厦门、桂林、再去、管理)。
(二)武夷山景区形象高频特征词语义网络分析
将提取的描述武夷山旅游形象的36个高频特征词进行两两共现分析,提取共现频数前10位的高频词(表3)。高频特征词两两共现频率较高的大部分均与武夷山共同出现,只有“风景、漂亮”这组高频词“脱离”“武夷山”。从两两共现的结果可以看出提及武夷山旅游者便会想起漂流、九曲溪、竹筏、茶、大红袍、丹霞地貌等内容。
如图1所示将36个高频特征词两两共现分析的结果导入UCINET软件,生成高频特征词的语义网络图。语义网络分析可以描绘游客感知的武夷山景区旅游形象,形象地呈现出各高频特征词之间的关系。从上图可以看出,武夷山景区形象的高频特征词以“武夷山”、“漂流”以及“风景”为中心簇布,主要词簇包括:“竹筏”、“九曲溪”、“天游峰”、“印象大红袍”、“山清水秀”以及“漂亮”。武夷山的漂流与风景是武夷山形象中最重要的组成部分,而“竹筏”等6个词簇则是其传播中最相关的特征。
(三)武夷山景区形象的消极感知因素分析
文章将搜集到的189条负面评论进行深入挖掘、归纳分析,采取逐级编码登录,将负面点评进行分类整理,挖掘提炼为5大核心类,12个二级子类,详见表4。
从上表4中可以看出:在所列5个核心类属中,“旅游体验”类消极感知因素所占比列最高,为42.91%。旅游体验所蕴含的需求结构是构成旅游竟争力的重要因素[18],而且旅游者越来越倾向于深度体验旅游模式。因此,如何在原有旅游活动基础上丰富旅游者体验成为弥补武夷山旅游短板的首要问题。在所登录的负面点评中,部分问题是缘于旅游者的个体因素,如个体的体质、旅游阅历及旅游态度等。部分问题由于天气、游客流量过大等客观因素造成。例如天气原因使得九曲溪水位急涨,无法漂流;针对这样的客观情祝,景区可以通过完善气象监测系统和预告系统来预先告知旅游者,以避免旅游者出现过大的心理落差而导致旅游体验满意度降低,同时开通紧急退票窗口,提高办事效率,协助旅游者挽回损失。此外,武夷山景观遭受破坏主要由于商业化过于严重,影响整体环境以及景区旅游者过多,影响了景观和谐等因素造成;开发者和管理者需要科学合理规划景区,使商业与旅游资源形成一个良性的整体;同时将旅游者人数控制在景区可接待人数和环境容量范围之内。
位列第二的消极感知因素是“旅游服务”。主要由于武夷山景区工作人员的服务意识缺乏、人员素质和服务效率等因素引起,景区管理工作也存在一定不足:散客买票困难、出现黄牛票、管理不善等。提升旅游体验度,不仅要丰富旅游体验活动,还要关注工作人员的服务意识和景区管理秩序。加强景区管理,加大监察,根除黄牛,打击野导,提升工作人员的服务态度与服务意识,提高办事效率,提供高质量的旅游服务。
排在第三位的消极感知因素是“旅游安全”,其中主要包括“财产安全”和“人身安全”。旅游者反映的主要财产安全问题是宰客现象严重,景区内价格高得离谱、茶叶价格水分过大等;旅游者反映的人身安全问题主要是治安不好和存在安全隐患。对于财产安全问题,有关部门应加大查处,杜绝虚假、不规范、不诚实经营,严厉查处宰客现象,还旅游者一个安全的购物环境;在景区管理方面,管理者必须加强管理,消除安全隐患,时刻把旅游安全这一工作原则和工作重点融入到各项工作中;针对治安问题,相关部门应该加强巡查,保证旅游安全。
“旅游设施”和“旅游环境”在负面评论中所占比例较小。需要指出的是,武夷山餐饮被许多旅游者诟病。很多旅游者提及武夷山饮食不合胃口,太辣、用餐环境太差。旅游者可在用餐之前进行询问,避免饮食口味不合;相关部门应为旅游者营造一个良好的用餐环境。旅游者也有提及一些设施陈旧、标识不够详细、生态破坏的问题,这需要景区管理者加强监察与巡视,排查安全隐患,对旅游设施维护、更新、保养,同时兼顾生态破坏问题。
从二级子类所体现的因素来看,客观因素、个体差异、财产安全和景区管理排在前四位,所占比例均超过10%,这必须引起景区方面的重视。针对于天气、游客流量这类客观因素,景区必须加强监测,给旅游者一个正确的引导;个体的体质、旅游阅历及旅游态度等也是造成的个体差异的重要影响因素;宰客现象、景区内购物价格过高则需要景区和相关管理部门的相互合作,加强管理,打击不法商贩,营造一个良好的购物环境;提升服务意识、提高服务效率、优化服务质量是景区亟待改善的相关管理问题。
四、研究结论与对策分析
文章以旅游者贡献的网络文本为研究对象,运用ROST Content Mining软件、UCINET软件,得出高频特征词及其语义网络关系,对负面评论逐一登录,分析旅游者的消极感知因素,得出相关结论,并提出促进武夷山景区的进一步发展的相关建议:
(1)利用ROST Content Mining软件提取描述武夷山旅游形象的36个高频特征词,并将其归纳为优美的风景和旅游景点、独特的人文环境与自然环境、丰富的游客体验和高度的游客满意三大主题。根据网络文本分析,风景、环境与游客体验三大主题成为旅游者感知武夷山形象的重要组成部分。在景区形象营销方面,可重点突出此三大主题。同时,继续深度挖掘旅游者网络文本中关于此三大主题的负面评论,对此进行优化提升。
(2)通过高频词的语义网络分析发现武夷山景区形象的高频特征词以“武夷山”、“漂流”以及“风景”为中心簇布,主要词簇包括:“竹筏”、“九曲溪”、“天游峰”、“印象大红袍”、“山清水秀”以及“漂亮”。漂流、风景、竹筏、九曲溪、天游峰则是通过旅游者网络文本反映出的武夷山景区的精华所在,为众多旅游者所向往。因此,在天游峰、九曲溪以及竹筏码头等地需要进行人流控制,对旅游者进行疏导与管控,加强旅游服务质量,提高旅游体验度和满意度。
(3)旅游者对武夷山旅游形象的消极感知因素可分为5个核心类属和12个子类。武夷山景区在旅游体验、旅游服务、旅游安全、旅游设施以及旅游环境等5大方面存在不足。景区应完善资源组合,深度开发体验项目,提升旅游体验;对景区内外的服务乱象进行整治,提升员工的服务技能和服务质量,形成优质旅游服务;注重旅游安全,推行诚信买卖,加强设施设备巡查,对旅游设施进行实时维护和保养;改善景区环境卫生,完善各类服务网络,优化旅游环境。
五、结束语
依据网络文本,利用ROST Content Mining和UCINET等软件进行高频特征词提取与语义分析,得出旅游者感知武夷山旅游形象的三大主题:风景、环境以及游客体验。而“竹筏”、“九曲溪”、“天游峰”、“印象大红袍”、“山清水秀”以及“漂亮”等则是三大主题的具体体现和高度概括。文章还归纳提炼出旅游者感知的负面形象并提出优化策略。需要指出的是,今后对于网络数据的研究不仅仅局限于网络文本,更可以拓展到旅游图片、旅游音频、旅游视频等材料;对于分析工具,多借鉴运用被国外研究领域广泛应用的CATPAC,WORDER,HAMLET,NVivo7.0和Atlas.ti等软件进行深入研究。
参考文献
[1]苗学玲,保继刚.“众乐乐”:旅游虚拟社区“结伴旅行”之质性研究[J].旅游学刊,2007,22(8): 48-54.
[2]Andsager J L,Drzewiecka J A.Desirability of differences in destinations[J]. Annals of Tourism Research,2002,29(2):401-421.
[3]Echfier C M.The content of Third World tourism marketing: A approach[J].The International Journal of Tourism Research,2002,4(6):413-434.
[4]Echtner C M,Ritchie J R B.The measurement of destination image:an empirical assessment[J].Journal of Travel Research,1993,31(3):3-13.
[5]Reilly MD.Free elicitation of descriptive adjectives for tourism imagination assessment[J].Journal of Travel Research,1990,28(3):21-26.
[6]Tapachai N,Waryszak R.An examination of the role of beneficial image in tourist destination selection [J].Journal of Travel Research,2000,39(8):37-44.
[7]杨杨.海峡两岸妈祖文化网络传播的差异研究——基于网络文本的内容分析[J].中国海洋大学学报,2013(3): 49-53.
[8]王亚奇.基于网络文本分析的喀纳斯徒步旅游行为研究[J].旅游管理研究,2013: 13-15.
[9]朱峰,吕镇.国内游客对饭店服务质量评论的文本分析一以e龙网的网友评论为例[J].旅游学刊,2006,21(5): 86-90.
[10]李龙梅,王晓峰,王俊霞.基于网络评论的兵马俑景区游客满意度评价[J].宁夏师范学院学报(自然科学),2011,32(6): 70-81.
[11]肖雪.基于顾客价值的饭店网络口碑营销影响因素分析[D].山东:中国海洋大学,2012.
[12]赵振斌,党娇.基于网络文本内容分析的太白山背包旅游行为研究[J].人文地理,2011,(1): 135-139.
[13]肖安明.酒店虚拟社区中在线评论对消费者购买意愿影响研究[D].广东:华南理工大学,2012.
[14]Chi C G Q,Qu H.Examining the structural relationships of destination image, tourist satisfaction and destination loyalty: An integrated approach [J].Tourism Management, 2008,29(4):624-636
[15]Creuves N,Skinner H.The importance of destination image analysis to UK rural tourism[J].Marheting Intelligence &Planning,2010,28(4):486-507.
摘 要:微博在改变信息传播方式的同时,受到社会各界的广泛关注。如何通过用户内容确定用户性格成为微博营销所要解决的关键问题之一。文章依据现阶段网络爬虫、文本分析、心理学性格分类研究的相关进展,提出一种基于微博内容分析确定微博用户性格的方法,对微博营销中基于用户性格的个性化推荐方式提供了有力保障。
关键词 :微博用户;文本分析;性格特征;模型
中图分类号:F820 文献标识码:Adoi:10.3969/j.issn.1665-2272.2015.05.023
随着21世纪信息技术的快速发展,以及人们对于电子产品的日益依赖,微博从早期传播即时消息、用户评论的舆论平台,到如今新闻传播的高效渠道,微博已经成为了一个较为多元化的综合平台,并最终逐渐成为表达现代人精神乃至情感方面的媒体。
在企业日益认识到微博对企业品牌价值影响这一背景下,微博作为近些年广受欢迎的社交网络平台,其使用用户的性格特征一直深受社会各界广泛关注。目前通过微博内容特征确定用户性格的研究基本停留在表象层面,尚未合理深入到用户的性格特征的研究层次。本文以传统词频分析法生产用户常用微博行为标签为基础,通过建立行为——性格对照表以及用户行为性格分析模型,提出一种基于用户微博内容的用户性格分析方法。
1 微博数据的获取
获取微博用户内容的方式主要有两种:一是通过网络爬虫爬取客户微博中所有的用户数据,然后在获取数据中提取用户内容;二是通过新浪微博的开放平台API直接获取站点服务器上的用户数据和内容。这两种方法获取微博数据都存在获取数据有限的弊端,但整体看来利用python编写爬虫程序获取微博用户内容相对较好。该方法实施步骤为:注册一个微博账户,然后用该注册账户关注所需抓取的目标用户的微博;分析新浪微博网页结构,利用python编写网络爬虫程序,并加载urlib库;将抓取的微博用户数据存入数据库中。
通过以上步骤,最终可以实现通过模拟浏览器行为获取页面标签,抓取新浪微博用户所发的微博内容、用户粉丝和关注数据,并将获取数据存储在指定数据库中。
2 微博用户性格分析的实现
2.1 行为标签词库的构建
微博用户在微博中的行为无外乎转发微博、发送原微博、评论、浏览这四种行为。用爬虫软件或开发商提供相应的接口程序抓取的大量微博用户数据后,可经过数据提取的方式获取用户内容,并选用特定的分词系统将微博用户内容进行分词;然后依据用户在微博中的行为,通过词频分析从用户内容中抽出能够代表某一行为的名词或者动作(可依据微博用户行为动作相关的词库进行人工判断或者运用相关软件进行抽词分析);并根据行为行为学、心理学等相关理论基础规范化这些抽取名词或者表达动作(在不损坏该词原有含义的情况下进行修正或者规范化),从而形成具有一定表现用户转发、评论、发表某微博当时动作或者心理状态的标签词。在创建行为标签词库过程中,如果某两个词之间具有近似含义,则可通过相关性程度判断的方法进行近似判断,进而规定其从属范围或者选用一个词作为标签代表与其含意相近的一类词。
2.2 行为——性格关系映射表的建立
通过行为标签词库的建立可以实现对微博用户内容及其行为的揭示,但微博用户内容及其行为与其性格的关系需要行为——性格关系映射表进行对应阐释。所建立的行为——性格关系表,主要功能是可以实现针对人类发出某个社会性动作(包括评论、直接的言语表达、对部分微博转发等动作),通过查找表中行为——性格的对应关系,反映当时微博用户心理的一种状态或者反应某人当时的一种性格上的某种属性值(诸如厌恶、喜爱、外向等)。
在行为——性格关系表建立过程中,既可以根据某些实际的性格特征(如外向),又能依据心理学性格分类的相关理论(例如MBIT、九型人格、霍兰德职业兴趣理论等),通过实践与心理学理论相结合的方法,进而更加具体地描述微博用户拥有的性格特征。在行为心理学一个多世纪的发展过程中,行为与人类心理理论的研究成果已经非常丰富,可以基本描述用户的性格——行为关系;并且在进行行为——性格表的制定的同时,还得可以运用诸如信息组织方面的技术手段,将行为表达词与性格表达词的格式进行规范化,以求最终得到符合使用要求的标签词用来建立行为——性格关系映射表。
2.3 用户性格获取模型的构建
行为标签词库与行为——性格关系映射表的建立可以实现通过分析微博用户内容,抽取用户微博行为标签(揭示微博用户行为的标签可以是一个,也可以是多个);然后依据行为——性格关系映射表中微博用户行为与性格的对映关系,获取用户的性格。在此过程中,可以借鉴信息检索中相关性判断机理以及语义判定等方面的理论,将行为——性格关系映射表中表示行为的词与行为标签词库中的词进行语义上的匹配,并从量化的角度判断两个相似词之间的相关程度,从而判断该标签词所能代表多大程度上的某种性格。该步骤的主要目的是将行为——性格关系映射表中表示行为的词与行为标签词库中的词进行统一规范化处理。在对同一用户性格进行描述时,一个用户可能具有多种性格,用户性格获取模型对用户性格分析的结果可以从多个方面进行量化。当然这一切必须在行为标签词库与行为——性格关系映射表建立的基础上,运用数学建模方面的技术手段及其原理,将整个运行机制生成一种可操作的模型,并将通过分析微博用户内容生成的行为标签词输入该模型,然后对应输出相关性格的排序。
总体来说,用户性格获取模型应该包括:微博用户内容获取工具(如爬虫)、文本分词系统、行为标签词库、行为——性格关系映射表、用户性格综合判定模型,以及可视化输入输出界面。
3 模型科学性的检验方法及优化
使用用户性格获取模型判定微博用户性格特征的科学性需要通过实际数据进行检验。在此,本文提出一种模型合理性的检验方法,仅供读者参考:使用python编写爬虫程序抓取数据时,在抓取的用户群中运用统计学的方法进行合理采样,抽出在部分用户作为样本;将抽取的微博用户的内容进行行为标签词处理,输入最终形成的模型当中,得出相应微博用户的性格特征;采用心理学人物性格分析方法,对抽取的样本用户发送心理学中有关性格调查方面的问问卷,进行用户性格测试;问卷回收之后,采用心理学人物性格分析方法对问卷进行整理分析,进而得出较为准确的用户性格;将问卷调查结果与模型分析结果相比较。运用相关性理论以及心理学方面对于两个描述性格特征近义词的相关理论进行判断,或者根据相关词典中对于语义的解释进行人为主观判断专家打分法,得出模型分析结果与问卷调查结果匹配的相似度;依据得到的相似度对构建模型的科学性进行评判,并作为模型改进的重要依据。
以上方法不仅可以作为评价构建模型科学性、合理性的重要手段,而且可以作为模型改进的重要依据,但在选取调查用户样本和设计调查问卷时应带注意样本选取的合理性以及问卷设计的科学性。
4 基于用户性格的个性化推荐方法
基于性格的推荐主要有两种实施方法:一是只考虑用户性格特征,指通过用户性格来计算用户相似度;二是通过在传统的协同过滤模型中加入用户性格这一指标,综合考虑用户性格特征和用户评分,通过加权计算得出最终用户相似度。
第一种方法首先需要获取用户的性格特征,然后考虑不同用户性格特征之间的相似度,选取不同用户之间相似值小于一定阀值的用户进行群体推销。在推销过程中可以选择以用户为角度、以对象为角度以及基于项目的不同推荐模式,最终实现基于用户性格的个性化推荐方法,为微博营销中的个性化推荐提供有力保障。第二种方法相比第一种略微复杂,需要综合考虑不同的用户属性以加权的方式获取用户的总体特征,并计算用户之间的相似值,但基本原理与第一种方法相当。
5 结语
从当前企业不能很好结合微博用户性格进行微博营销这一实际出发,提出一种通过运用传统词频分析生成用户微博行为标签(该标签揭示微博用户某内容所表达的行为及含义),构建行为——性格关系对映表的微博用户性格获取模型,使基于微博内容的用户性格特征分析得以系统化、模型化实现,并为微博营销中基于微博用户性格的个性化推荐奠定了基础。
参考文献
1 李轩.基于性格区分的客户分类营销探讨[J].中国市场,2012(26)