200

      web日志挖掘的信息無障礙網站設計研究

      時間: 2013-06-20 15:49:59   點擊數: 65976   來源: 耐思智慧

      免費會員注冊

      0.引言

      隨著信息技術和網絡技術的不斷發展,互聯網給現代人們獲取信息帶來極大的便利,成為人們工作生活中非常重要的組成部分。信息無障礙即萬維網對任何人士(包括殘障人士)都是可訪問、可用的,殘障人士能感覺、理解和操縱Web,與Web 互動。如何借助先進的技術,消除數字鴻溝,為殘疾人提供有效的輔助手段,使他們能和健全人一樣無障礙地獲取網上信息,得到世界各國政府和組織越來越多的重視。
      1.信息無障礙網站存在的問題
      很多部分實現了信息無障礙的網站,用戶每次訪問時,網站語音都得從頭到尾的播報網站內容,對于該用戶曾經訪問過本網站中部分頁面內容期刊網,系統不能自動過濾掉這些已經閱讀的內容,或者跳過這些已閱讀信息,而是依然按照布局順序重復播報。這對于閱讀障礙的用戶來說非常浪費時間和精力。避免重復瀏覽或者播報網站信息,將用戶曾經閱讀過的內容過濾掉,將沒有閱讀過的最新的感興趣的網頁內容優先播報給閱讀障礙用戶,提供智能化、個性化信息服務,是信息無障礙網站設計應該重視的問題。
      2. web日志挖掘
      web日志文件是在web服務器上每隔一定的時間產生的記錄文件,其內容包括訪問用戶的IP地址,訪問時間、訪問的頁面、頁面的大小、瀏覽器類型、響應狀態等等。web日志挖掘是對用戶訪問Web時服務器方留下的訪問記錄進行挖掘,得到用戶的訪問模式和訪問興趣。通過對Web站點的日志記錄進行預處理,將日志數據組織成傳統的數據挖掘方法能夠處理的事務數據形式,然后利用傳統的數據挖掘方法進行處理。
      web日志預處理過程:
      (1)數據收集 從服務器端數據、客戶端數據、代理服務器端進行。
      (2)數據凈化 刪除Web日志文件中不是由用戶請求,而是由瀏覽器自動“請求”產生的訪問記錄。具體包括圖片和音頻文件、樣式文件和腳本文件、不是GET的HTTP方法、彈出式廣告的記錄等。
      (4)會話識別 用戶在規定時間內對服務器的一次有效訪問,通過其連續請求的頁面,可以獲得其在網站中的訪問行為和瀏覽興趣,有4種識別會話的模型:頁面類型模型(page type model),參引長度模型(reference length model),最大前向參引模型(maximal forwordreference model)和時間窗口模型(time window model)。最常采用的是時間窗口模型,以用戶訪問時間作為劃分會話的分界,一般間隔時間取30min。
      (5)路徑補充 用戶有時瀏覽的頁面,是從本地緩存和代理服務器中調用的,不會向Web服務器發送請求,也就不會記錄日志,而這些請求可能對后續挖掘的實施有重要作用期刊網,缺少這些頁面記錄可能會使挖掘結果不是很準確。為了能更精確的挖掘用戶的行為模式,有必要把這些缺失的路徑補充上去即路徑補充。如果當前請求的頁與用戶上一次請求的頁之間沒有超文本鏈接,那么用戶很可能使用了瀏覽器上的“BACK"按鈕調用緩存在本機中的頁面。如果用戶的歷史訪問記錄有多個頁面都包含與當前請求頁的鏈接,則將請求時間最接近的Web頁的頁面作為當前請求的來源。
      3.基于web日志挖掘的網站設計
      3.1網站設計架構
      網站為每位存在訪問障礙的用戶建立網站訪問記錄數據庫,用戶訪問網站頁面,產生web日志文件,通過對web站點日志文件進行數據凈化、用戶識別、會話識別,將有用數據存入事務數據庫,對該用戶訪問過的頁面進行相應標記,再對事務數據庫進行傳統的數據挖掘,分析出該用戶比較感興趣的信息類型,為該用戶對網站所有類型信息構造優先顯示頁面類型序列表和對每類信息未訪問頁面、已訪問頁面分別構造優先序列表,當該用戶再次訪問網站時利用離線分析所得的優先序列表和網站文件映射數據庫將網頁鏈接按照用戶興趣高低動態填充到網站導航框架,這樣用戶最感興趣類型的網頁鏈接總是弄夠最先看到、聽到,從而達到優先訪問的目的。
      網站設計框架如下圖:
      圖1 信息無障礙網站設計框架
      3.2 網站導航
      網站導航是根據信息無障礙網站結構布局設計標準所設計的網站通用布局框架,除了包括信息無障礙要求的導航磚,通用切換等功能,還將頁面設計成由幾個通用的布局框架模塊組成,每個框架模塊將顯示網站上某一種類型的網頁信息鏈接,具體網頁鏈接內容則根據序列表先后順序動態填充。網站所包含的信息類型可以有很多,但在網站導航中只列出用戶最感興趣的幾種類型的網頁鏈接,隨著用戶興趣的改變,其他類型的網頁鏈接將動態的填充到相應級別的框架模塊中。
      3.3 興趣提取
      根據用戶瀏覽的歷史訪問記錄(內容信息和行為信息)、訪問時間和訪問頻率等來分析計算用戶興趣度,用戶的興趣一般集中于某一個主題或者多個主題期刊網,系統在通過聚類進行分析將用戶瀏覽的歷史頁面集自動地分成n個聚簇(n是聚類中聚類中心的數目),每一聚簇的頁面集體現了用戶的某類興趣,構造形成用戶的興趣類。再利用用戶的隱式信息學習提取用戶興趣集,建立樹狀的用戶興趣模型。
      3.4 序列模式
      序列模式挖掘是對關聯規則挖掘的進一步推廣,它挖掘出序列數據庫中項集之間的時序關聯規則。關聯規則強調的是兩個項之間的關聯,序列模式則加強調兩者之間的先后次序。這里我們將挖掘出兩種序列表:類型序列表和頁面序列表。類型序列表是通過對歷史訪問記錄進行挖掘統計出來的網站每種類型信息訪問優先等級,是一組有序項集對應表;頁面序列表則是以類型挖掘權值和更新時間2個指標得出的頁面訪問有序集對應表?梢圆捎没贏pfiori算法的改進算法進行挖掘得到上述兩種序列表。
      3.5 序列-頁面映射
      根據挖掘得到的序列模式對網站的靜態頁面文件進行一一映射,按照興趣高低和文件序列先后動態的填充如網站導航模塊框架中。
      4.結束語

      本文所提出對web日志文件挖掘提取用戶的興趣類和訪問類型和頁面優先序列,重構站點頁面之間的鏈接關系,動態顯示網頁信息的設計框架,以適應有障礙用戶的訪問興趣習慣為主要目標,在一定程度上可以避免反復無用的頁面瀏覽和語音播報所造成的對存在訪問障礙用戶產生的困擾和時間精力的浪費,提高了訪問效率,為消除信息鴻溝,真正做到信息人人共享發揮積極的作用。

      更多網站建設資料:

      Microsoft SQL Server Management Studio 如何導入導出數據
      國內社交網站創新研究及網站盈利模式
      如何去建立一個好的網站
      傳統文化網頁設計編排重點
      電子商務網站建設規劃
      上一篇:網站建設的本質意義是什么,企業為什么要建設公司網站? 下一篇:Microsoft SQL Server Management Studio 如何導入導出數據

      旗下網站:耐思智慧 - 淘域網 - 我的400電話 - 中文域名:耐思尼克.cn 耐思尼克.top

      耐思智慧 © 版權所有 Copyright © 2000-2025 IISP.COM,Inc. All rights reserved

      備案號碼: 粵ICP備09063828號  公安備案號: 公安備案 粵公網安備 44049002000123號  域名注冊服務機構許可:粵D3.1-20240003 CN域名代理自深圳萬維網

      聲明:本網站中所使用到的其他各種版權內容,包括但不限于文章、圖片、視頻、音頻、字體等內容版權歸原作者所有,如權利所有人發現,請及時告知,以便我們刪除版權內容

      本站程序界面、源代碼受相關法律保護, 未經授權, 嚴禁使用; 耐思智慧 © 為我公司注冊商標, 未經授權, 嚴禁使用

      法律顧問:珠海知名律師 廣東篤行律師事務所 夏天風 律師

      主站蜘蛛池模板: 乱子伦一区二区三区| 色欲AV蜜桃一区二区三| 久久国产午夜一区二区福利| 91无码人妻精品一区二区三区L| 国产福利一区二区在线视频| 亚洲国产av一区二区三区| 亚洲一区中文字幕在线观看| 中文字幕在线精品视频入口一区| 日韩精品一区二区三区不卡| 波多野结衣一区在线观看| 日本精品一区二区三区在线视频 | 亚洲AV成人一区二区三区AV| 日韩一区二区三区在线观看| 冲田杏梨AV一区二区三区| 最新中文字幕一区| 精品无码人妻一区二区三区| 免费av一区二区三区| 亚洲av无码片区一区二区三区| 亚洲一区二区三区无码中文字幕| 美女视频免费看一区二区| 国产拳头交一区二区| 国产精品一区二区av| 国模精品一区二区三区| 精品亚洲A∨无码一区二区三区| 国产亚洲情侣一区二区无| 国产福利电影一区二区三区久久久久成人精品综合 | 女人和拘做受全程看视频日本综合a一区二区视频 | 日韩制服国产精品一区| 少妇特黄A一区二区三区| 日韩三级一区二区三区| 成人H动漫精品一区二区| 国产精品538一区二区在线| 国产伦精品一区二区三区免费下载| 成人无码精品一区二区三区| 国产视频一区二区| 国产精品一区二区三区99| 又硬又粗又大一区二区三区视频| 国产精品无码AV一区二区三区| 亚洲色大成网站www永久一区| 无码人妻精品一区二区三区99仓本 | 韩日午夜在线资源一区二区|