因为page啊,query啊能自然地表示成点,他们之间的联系可以表示为边,然后可以应用graph learning……
IR里最有名的应用估计就是pagerank了,大致就是定义在图上的lazy random walk,stable状态,每个点的f就是求转移矩阵的特征向量。
之后有些工作做bigraph的,比如 click graph,Random Walks on the Click Graph,m$做的。click graph就是bigraph,一边是query,一边是link,然后通过log建图。那篇paper做的是query recommendation,就是用户提交了一个query,然后通过random walk来找到点到相同link的query
Learning Query Intent from Regularized Click Graphs这篇文章很有意思,也是m$做的,虽然只是想解决是不是一个query需要垂直搜索。还是在click graph里,想分成2个cluster,但是有一些query 被标记好是需要的,一些是不需要的,希望每个labeled点被分到的类一致,所以加了一项loss;然后还觉得不够,就根据query的word做了个最大熵分类器,加成了loss@@
然后dengyong zhou做了hypergraph,directed graph,multiview graph的spectral learning,我觉得这些个东西应用很不错。multiview graph就可以做一个undirected graph和directed graph叠加,比如page之间的link信息和相似度信息;hypergraph可以用来做建立在人上的group……
其实我觉得做例如facebook上的group recommender,或者blog subscriptions recommender,其实query recommender也可以用hypergraph来做还挺有意思的,但是denny觉得这些都太无聊……我还是很喜欢denny的工作的,基本没有灌水的成分,而且跟他聊觉得他做research的想法也很正直……我还是很看好他的东西在IR上的应用的~