个性化系统就是能够针对不同用户的信息需求表现出不同运行效果的软件,而这样的软件提供的服务就是个性化服务。个性化系统的核心是用户建模,即对用户信息需求的模型表示。
基本概念
用户建模是个性化系统的核心。概括地说,用户建模是对用户信息的一种表示,主要包括三个问题:对什么建模、如何建模、如何维护模型。
用户兴趣建模是一个复杂的过程,既包括用户相关信息的收集与挖掘,还包括用户兴趣的提取和表示,以及长期兴趣、近期兴趣、即时兴趣的组织与维护?以上各个方面相互联系相互作用,共同构成一个完整的用户建模体系,例如用户兴趣模型采用的表示方法决定了信息收集时必须记录的信息,同时也决定了长期兴趣、近期兴趣、即时兴趣的组织结构。
建模方法
建模方法包括三个方面:一是如何获得用户的有用信息;二是用户模型的表示方法问题;三是如何将前两个方面结合起来,从而产生出用户的模型。
建模是一个过程,包括很多方面,不同应用背景下建模过程也会不同,但一般至少包括以下三个方面:一是用户行为的模型和表示,并根据该模型记录用户具体访问行为,产生出用户行为日志;二是根据用户的行为模式评价用户对所访问的信息项的关注程度;三是根据用户所访问的信息内容对用户的兴趣进行提取和量化评价,构建用户的兴趣模型。这信息内容对用户的兴趣进行提取和量化评价,构建
用户的兴趣模型。这三个问题密切相关,前一个问题均为解决后一个问题的前提或基础。
由于用户信息会发生转变,因此需要提供一个动态跟踪机制来捕获这些变化,从而能分辨出不同兴趣之间的差异:用户兴趣模型的变化主要表现在兴趣度的衰减和强化两方面,并由此表现出用户兴趣的迁移。从整个用户行为历史来看,每个兴趣点被访问的次数是单调增长的,因此相应的兴趣度都在被强化;而衰减的目的是表达一个兴趣点如果在最近一段时间内没有被访问,则其兴趣度应该被降低。
为了正确捕获用户的兴趣模型,可将用户兴趣可分为三种情况。一是长期兴趣,反映了用户稳定的长期的信息需求,这些兴趣会随着时间推移积累成广泛的兴趣点,这将导致信息推荐发散在多个主题上,从而缺乏针对性;二是近期兴趣,反映了用户最近一个时间段内的信息需求趋势,基本目标是根据用户的近期访问行为,在用户长期兴趣中选择几个作为用户近期的关注焦点,从而克服基于长期兴趣进行推荐的问题;三是即时兴趣,反映的是用户在与系统交互过程中的实时信息需求,其可能是某个稳定兴趣的体现,也可能是与长短期兴趣均无关的临时性的信息需求。
尽管三种用户兴趣互不相同,但它们之间又有着内在的联系:概括地说,即时兴趣是近期兴趣的累积基础,而近期兴趣是长期兴趣的累积基础;即时兴趣和近期兴趣能够反映用户需求的动态变化,而长期兴趣则体现了用户较为稳定的信息需求。
用户模型的动态特征捕获值得进一步深入研究。目前主要采用的方法是通过近期兴趣来建立用户当前的兴趣点,从而捕获用户兴趣的变化。一般而言,近期兴趣和长期兴趣在建模过程上是相似的,只是前者将时间限制在某个特定阶段内i因此,用户模型的动态特征捕获方法尽管有一定的效果,但其模型基础并不完善,表现在以下几个方面:①长期兴趣与近期兴趣并没有统一在一个框架之下;②长期兴趣与近期兴趣之间的关系并不明确;③并未涉及衰减和强化两方面的机制问题,因此也不能刻画用户兴趣的迁移模式。
建模技术
用户手工定制建模
用户手工定制建模是指用户模型由用户自己手工输入或选择的用户建模方法。如用户自己输入感兴趣的关键词列表,或选择感兴趣的栏目等。
但用户手工定制建模存在着以下几个方面的不足:
第一,因为建模过程完全依赖于用户,容易降低用户使用系统的积极性;用户不愿意参与对系统的训练,即使用户知道对系统进行训练会给自己带来好处。
第二,用户难以全面、准确地罗列自己感兴趣的栏目或关键词,从而导致用户模型不够准确;
第三,当用户兴趣发生变化时,用户必须重新输入用户模型;用户手工定制的用户模型是静态的,这与用户兴趣的渐变性不符。
示例用户建模
示例用户建模是指由用户提供与自己兴趣相关的示例及其类别属性来建立用户模型的建模方法。由于用户对自己的兴趣和偏好等最有发言权,因此由用户提供的有关自己兴趣的示例最能集中、准确地反映用户的兴趣和偏好等特点。
自动用户建模
自动用户建模是指根据用户的浏览内容和浏览行为自动构建用户模型,建模过程无须用户主动提供信息的建模方法。自动用户建模的主要代表有:卡内基·梅隆大学的WebWatcher,德国国家研究中心的ELFI,
麻省理工学院的Letizia等。
自动用户建模实际上是改进了示例用户建模方法中的示例获取途径,将其转化为无须用户标注的自动示例获取方法。通过对用户浏览页面的聚类和分类,就能够得到用户感兴趣的主题,从而实现自动建模。此外,
Web日志挖掘也是一条实现自动用户建模的途径。
自动用户建模虽然存在着容易引入噪声,不利于构建高质量的用户模型的缺点,但是,自动用户建模无需用户主动提供信息,不会对用户造成干扰,有利于提高
个性化服务的易用性,促进个性化服务的发展。