日本在线观看,国产激情视频一区二区在线观看 ,а√天堂资源官网在线资源,性网站在线看,久久99影视,国产精品嫩草影院av蜜臀,精品久久久香蕉免费精品视频,欧美日韩国产一区二区三区地区,国产性做久久久久久,在线看成人短视频

Categories


Tags


搶先式多線程網絡蜘蛛

Win32 API 支持搶先式多線程網絡,這是編寫MFC網絡蜘蛛非常有用的地方。SPIDER工程(程序)是一個如何用搶先式多線程技術實現在網上用網絡蜘蛛/機器人聚集信息的程序。

該工程產生一個象蜘蛛一樣行動的程序,該程序為斷開的URL鏈接檢查WEB站點。鏈接驗證僅在href指定的鏈接上進行。它在一列表視圖CListView中顯示不斷更新的URL列表,以反映超鏈接的狀態。本工程能用作收集、索引信息的模板,該模板將這些信息存入到可以用于查詢的數據庫文件中。

搜索引擎在WEB上使用叫作Robots(也叫爬蟲,蜘蛛,蠕蟲,漫步者,滑行者等等)的程序收集信息,它從WEB上自動地聚集和索引信息,接著將這些信息存入數據庫。(注意:一個機器人將搜索一個頁面,然后把這個頁面上的鏈接作為將要索引的新的URL的起點)用戶可創建查詢去查詢這些數據庫以發現他們需要的信息。

通過搶先式多線程地使用,你能索引一個基于URL鏈接的WEB頁面,啟動一個新的線程跟隨每個新的URL鏈接,索引一個新的URL起點。本工程使用和自定義的MDI子框架一起使用的MDI 文檔類,在下載WEB頁面時顯示一個編輯視圖,在檢查URL連接時顯示一個列表視圖。另外,本工程使用了CObArray,CInternetSession,CHttpConnection,ChttpFile和CWinThread MFC類。CWinThread類用于產生多線程來代替在CInternetSession類中的異步模式,這種模式是從insock的16位windows平臺保留下來的。SPIDER工程使用簡單的工作線程去檢查URL鏈接,或者下載一個Web頁面。CSpiderThread類是從CWinThread類中派生的,所以,每個CSpiderThread對象可以使用CWinThread 的MESSAGE_MAP()函數。通過在CSpiderThread類中聲明"DECLARE_MESSAGE_MAP()",用戶接口可以響應用戶的輸入。這意味著你可以在一個Web服務器上檢查URL鏈接的同時,你可以從另一個Web服務器上下載或打開一個Web頁面。只有在線程數超過定義為64的MAXIMUM_WAIT_OBJECTS時,用戶接口將不會響應用戶的輸入。在每個CSpiderThread對象的構造函數中,我們提供了ThreadProc函數以及將傳送到ThreadProc函數的線程參數。

CSpiderThread* pThread;

pThread = NULL;

pThread = new CSpiderThread(CSpiderThread::ThreadFunc,pThreadParams); // 創建一個新的 CSpiderThread 對象;

在類CSpiderThread 構造函數中我們在線程參數中設置指針CWinThread* m_pThread ,于是我們可以指向這個線程正確的事例:

pThreadParams->m_pThread = this;

The CSpiderThread ThreadProc Function

// 簡單的工作線程函數

UINT CSpiderThread::ThreadFunc(LPVOID pParam)

{

ThreadParams * lpThreadParams = (ThreadParams*) pParam;

CSpiderThread* lpThread = (CSpiderThread*) lpThreadParams->m_pThread;

lpThread->ThreadRun(lpThreadParams);

// 這里使用SendMessage代替PostMessageUse,以保持當前線程數同步。

// 如果線程數大于 MAXIMUM_WAIT_OBJECTS (64), 本程序將變得不能響應用戶輸入

::SendMessage(lpThreadParams->m_hwndNotifyProgress,

WM_USER_THREAD_DONE, 0, (LPARAM)lpThreadParams);

// 刪除lpThreadParams 和減少線程總數

return 0;

}

這個結構傳遞給CSpiderThread ThreadProc函數

typedef struct tagThreadParams

{

HWND m_hwndNotifyProgress;

HWND m_hwndNotifyView;

CWinThread* m_pThread;

CString m_pszURL;

CString m_Contents;

CString m_strServerName;

CString m_strObject;

CString m_checkURLName;

CString m_string;

DWORD m_dwServiceType;

DWORD m_threadID;

DWORD m_Status;

URLStatus m_pStatus;

INTERNET_PORT m_nPort;

int m_type;

BOOL m_RootLinks;

}ThreadParams;

CSpiderThread對象創建后,我們用CreatThread函數開始一個新的線程對象地執行。

if (!pThread->CreateThread()) //開始一 CWinThread 對象地執行

{

AfxMessageBox("Cannot Start New Thread");

delete pThread;

pThread = NULL;

delete pThreadParams;

return FALSE;

}

一旦新的線程正在運行,我們使用::SengMessage函數發送消息到 CDocument's-> CListView ,這個消息帶有URL鏈接的狀態結構。

if(pThreadParams->m_hwndNotifyView != NULL)

::SendMessage(pThreadParams->m_hwndNotifyView,WM_USER_CHECK_DONE, 0, (LPARAM) &pThreadParams->m_pStatus);

URL狀態的結構:

typedef struct tagURLStatus

{

CString m_URL;

CString m_URLPage;

CString m_StatusString;

CString m_LastModified;

CString m_ContentType;

CString m_ContentLength;

DWORD m_Status;

}URLStatus, * PURLStatus;

每個新的線程建立一個新的CMyInternetSession類(派生于CInternetSession)對象,并把 EnableStatusCallback設置為TRUE,于是,我們可以在所有的InternetSession回調時檢查狀態。將回調使用的dwContext ID設置為線程ID。

BOOL CInetThread::InitServer()

{

try

{

m_pSession = new CMyInternetSession(AgentName,m_nThreadID);

int ntimeOut = 30; // 很重要!如果設置太小回引起服務器超時,如果設置太大則回引起線程掛起。

/*

網絡連接請求時間超時值在數毫秒級。如果連接請求時間超過這個超時值,請求將被取消。

缺省的超時值是無限的。

*/

m_pSession->SetOption(INTERNET_OPTION_CONNECT_TIMEOUT,1000* ntimeOut);

/* 在重試連接之間的等待的延時值在毫秒級。*/

m_pSession->SetOption(INTERNET_OPTION_CONNECT_BACKOFF,1000);

/* 在網絡連接請求時的重試次數。如果一個連接企圖在指定的重試次數后仍失敗,則請求被取消。 缺省值為5。 */

m_pSession->SetOption(INTERNET_OPTION_CONNECT_RETRIES,1);

m_pSession->EnableStatusCallback(TRUE);

}

catch (CInternetException* pEx)

{

// catch errors from WinINet

//pEx->ReportError();

m_pSession = NULL;

pEx->Delete();

return FALSE ;

}

return TRUE;

}

在一個單或多線程程序中使用MFC WinIne類,關鍵是要在所有MFC WinInet類函數周圍使用try和catch塊。因為互連網有時很不穩定,或者你訪問的Web頁面已不存在,則這種情況下,將拋出一個CInternetException錯誤。

try

{

// some MFC WinInet class function

}

catch (CInternetException* pEx)

{

// catch errors from WinINet

//pEx->ReportError();

pEx->Delete();

return FALSE ;

}

最初線程數最大設置為64,你可以將它設置為從1到100的任何數。設置太高會使鏈接失敗,意味著你將不得不重新檢查URL鏈接。在/cgi-bin/目錄下一個連續不斷地迅猛地HTTP請求會使服務器崩潰。SPIDER 程序在1秒中發送四個HTTP請求,1分鐘240個。這也將會使服務器崩潰。在任何服務器上你檢查時放仔細一點。每個服務器都有一個請求Web文件的請求代理IP地址的日志。你或許會收到來自Web服務器管理員的齷齪的郵件。

你可以為一些目錄建立robots.txt 文件來防止這些目錄被索引。這個機制通常用于保護/cgi-bin/ 目錄。CGI腳本占用更多的要檢索的服務器資源。當SPIDER程序檢查URL鏈接時,它的目標是不太快地請求太多的文檔。SPIDER程序堅持機器人拒絕的標準。這個標準是機器人開發者之間的協議,允許WWW站點限制URL上的機器人的請求。通過使用這個限制訪問的標準,機器人將不檢索Web服務器希望拒絕的任何文檔。在檢查根URL前,程序檢查看是否有robots.txt文件在主目錄下。如果SPIDER程序發現robots.txt文件,將放棄搜索。另外,程序也檢查所有Web頁面中的META標記。如果發現一個META標記,它的NAME="ROBOTS" CONTENT ="NOINDEX,NOFOLLOW",則不索引那個頁面上的URL。

創建:

Windows 95

MFC/VC++ 5.0

WinInet.h 時間 9/25/97

WinInet.lib 時間 9/16/97

WinInet.dll 時間 9/18/97

來源:月光博客


Public @ 2022-07-19 16:22:28

BaiDuSpider百度蜘蛛占用流量,robots.txt設置

BaiDuSpider是百度搜索引擎自動抓取網頁的蜘蛛程序。由于蜘蛛程序需要不斷訪問網站上的頁面,所以會占用一定的流量資源。對于網站管理員來說,如果BaiDuSpider的訪問量過大,也會對網站的帶寬和性能造成一定的負擔。 為了避免BaiDuSpider的過度訪問,網站管理員可以通過在網站根目錄下創建robots.txt文件,來控制搜索引擎蜘蛛的訪問。通過設置robots.txt文件,可以告訴B

Public @ 2023-03-31 08:00:24

頭條搜索Bytespider IP反解析

反查IP站長可以通過DNS反查IP的方式判斷某只spider是否來自頭條搜索引擎。根據平臺不同驗證方法不同,如linux/windows/os三種平臺下的驗證方法分別如下在linux平臺下,您可以使用host ip命令反解ip來判斷是否來自Bytespider的抓取。Bytespider的hostname以*.bytedance.com的格式命名,非 *.bytedance.com即為冒充host

Public @ 2013-03-31 15:38:59

網站的搜索引擎蜘蛛抓取越多越好?事實未必

如此 實際上,搜索引擎蜘蛛抓取越多并不一定是越好的。這取決于您的網站是做什么的。如果您的網站有重要的動態內容,那么如果您的搜索引擎蜘蛛抓取過多,將會給您的網站帶來壓力,導致網站性能和速度下降。如果您的網站是基于靜態內容的,例如博客,則搜索引擎蜘蛛抓取更多是沒有問題的。

Public @ 2023-02-24 16:00:16

更多您感興趣的搜索

0.550139s
精品一区免费av| a成人v在线| 欧美婷婷六月丁香综合色| 欧美系列电影免费观看| 高清国产福利在线观看| 亚洲成色www8888| 国产做a爰片久久毛片| 日本aa在线| 国产精品免费网站| 欧美va亚洲va在线观看蝴蝶网| 日韩成人精品一区| 在线观看美女网站大全免费| 久久久影视精品| 亚洲国产一二三| 美女一区二区在线观看| 国产精品热视频| 亚洲精品一区中文| 亚洲国产精品久久艾草纯爱| 国产麻豆一区二区三区精品视频| 色婷婷视频在线观看| 亚洲欧美日本精品| 成人av午夜电影| 国产一区二区三区免费在线| 81精品国产乱码久久久久久| 精品国产精品一区二区夜夜嗨| 国产视频欧美| 国产高清不卡| 青青草观看免费视频在线| 色噜噜国产精品视频一区二区| 午夜激情综合网| 欧美国产丝袜视频| 亚洲国产成人精品女人| 日韩mv欧美mv国产网站| 美女露胸视频在线观看| www日韩tube| 欧美成人免费播放| 日韩高清中文字幕| 久久女同性恋中文字幕| 国产一区二区三区免费播放| 一区二区三区国产盗摄| 国产毛片精品久久| 小香蕉视频在线| 911国产网站尤物在线观看| 色综合色狠狠天天综合色| 国产免费观看久久| 久久久久久久久97黄色工厂| 国产精品综合二区| youjizz国产精品| 国产电影精品久久禁18| 日本美女一区二区三区| 蜜桃一区二区| 亚洲毛片播放| 久久综合伊人| 盗摄精品av一区二区三区| 97久久超碰精品国产| 久久天堂av综合合色蜜桃网| 97国产一区二区| 国产精品久久久久久久蜜臀| 国产精品欧美久久久久无广告| 久久久久99精品国产片| 中文字幕字幕中文在线中不卡视频| 国产亚洲精品免费| 欧美色视频日本高清在线观看| 激情成人中文字幕| 精品久久99ma| 欧美激情伊人电影| 久久国产精品久久久久| 欧美一级在线亚洲天堂| 国内精品卡一卡二卡三新区| 久久综合九色综合久| 国产ktv在线视频| 黄在线观看免费网站ktv| 国产精品qvod| 欧美精品九九| 91玉足脚交白嫩脚丫在线播放| 亚洲一区二区三区四区在线免费观看| 欧美在线看片a免费观看| 在线观看国产精品网站| 亚洲成人精品在线| 97视频在线观看视频免费视频 | 国产高清不卡一区| 亚洲成人av一区二区| 伊人久久五月天| 天天夜夜亚洲| 久久青草免费| 日本va欧美va精品| 精品久久中文字幕久久av| 欧美黑人xxxx| 1区2区3区在线视频| 999视频精品| 欧美aaaaaa午夜精品| 欧美日韩成人一区二区| 91精品国产自产在线老师啪 | 精品亚洲成a人在线观看| 色综合中文字幕| 欧美精品一区二区蜜臀亚洲| 天天干夜夜干| 成人国产精品一区二区免费麻豆| 伊人久久成人| 欧洲一区在线观看| 国产精品人成电影在线观看| 国产精品一级伦理| 狠狠干成人综合网| www.亚洲色图| 欧美情侣性视频| a天堂中文在线88| 欧美午夜视频| 国产高清亚洲一区| 最好看的2019年中文视频| 波多野结衣中文字幕久久| 极品中文字幕一区| 日韩精品一区二区三区三区免费| 久久精品成人欧美大片古装| 国产真实伦在线观看| 香蕉视频亚洲一级| 精品999成人| 伊人夜夜躁av伊人久久| 中文字幕一区日韩电影| 久久免费看视频| 极品尤物一区| 欧美日韩成人一区二区| 亚洲pron| 欧美综合一区| 亚洲综合激情网| 国产在线导航| 国产精品久久久久蜜臀 | 国产激情视频在线看| 成人国产精品免费网站| 国产成人精品久久二区二区91 | 麻豆成人av在线| 乱亲女秽乱长久久久| 在线成人动漫av| 欧美一区二区在线视频| 国产区视频在线观看| 久久国产精品美女| 亚洲激情综合网| 国产高清在线观看| 久久婷婷一区二区三区| 久久人人爽人人爽爽久久| 136福利精品导航| 国产视频亚洲色图| 黄色av地址| 国产成人无遮挡在线视频| 亚洲欧美日韩另类| 久久国产精品免费精品3p| 欧美日本一区二区在线观看| 中文在线8资源库| 91天堂素人约啪| 黄页免费在线| 欧美日韩国产一区二区三区不卡 | 亚洲s色大片在线观看| 99国产精品久久| 国产1区2区3区在线| 亚洲欧美综合色| 国产精品欧美久久久| 久久高清精品| 日韩免费一区二区| huan性巨大欧美| 91影院在线免费观看| 激情成人四房播| 成人激情免费网站| 国产精品永久免费在线| 久久社区一区| 欧美福利网站| 91在线观看高清| yellow91字幕网在线| 在线看日本不卡| 国产精品一在线观看| 国产97在线观看| 国产精品国产三级国产普通话三级| 在线毛片观看| 日韩精品中文字幕久久臀| 国产精品成人3p一区二区三区| 亚洲国产精品尤物yw在线观看| 亚洲福利影视| 色综合久久88色综合天天看泰| 国产麻豆成人精品| 1234区中文字幕在线观看| 国产精品福利在线播放| 韩漫成人漫画| 日韩亚洲第一页| 综合一区在线| 日本美女高清在线观看免费| 悠悠色在线精品| 欧美黄在线观看| 免费网站成人| 日韩经典第一页| 蜜臀久久久久久久| 亚洲优女在线| 全球成人中文在线| 欧美日韩性生活视频| 欧美性色综合| 黄页视频在线观看| 亚洲国产成人精品久久| 国产一区二区在线视频| 欧美专区一区| 亚洲免费av一区二区| 亚洲男人天堂网站| 亚洲欧美日韩国产一区二区三区 | 中文字幕一区二区三区四区|