Watchman Mac版是Mac平臺上的一款易于使用的網(wǎng)站存檔工具。Watchman Mac版可以監(jiān)控整個網(wǎng)站、部分網(wǎng)站或單個頁面,可以為多個站點/頁面設(shè)置配置,安排每小時,每天,每周,每月掃描。
對任何更改、可見文本、源代碼或頁面資源的更改發(fā)出警示,查看并能夠演示頁面在特定日期的外觀。
注意競爭對手的頁面/站點的每一個變化,本地運行,而不是云服務(wù)。擁有自己的數(shù)據(jù)。
保存一個歸檔文件,包括對頁面、圖像、樣式表和js的所有更改,查看歷史頁面的“活”版本,而不是屏幕截圖。
在頁面的不同版本之間切換以進行比較,將歷史頁面導(dǎo)出為圖像或其所有文件的集合。
1、監(jiān)視整個網(wǎng)站,網(wǎng)站的一部分或單個頁面
2、設(shè)置多個站點/頁面的配置
3、計劃每小時,每天,每周,每月掃描
4、收到任何更改,可見文本,源代碼或頁面資源更改的警報
5、能夠演示特定日期頁面的外觀
6、注意競爭對手頁面/站點的每一次更改
7、在本地運行,而不是云服務(wù)。擁有自己的數(shù)據(jù)。
8、保留存檔*,包括對頁面,圖像,樣式表和js的所有更改
9、查看歷史頁面的“活版”版本,而不是屏幕截圖
10、在頁面版本之間切換以進行比較
11、將歷史頁面導(dǎo)出為圖像或所有文件的集合
12、導(dǎo)出整個站點,保留所有文件在給定日期的原樣,或進行處理以制作可瀏覽的站點本地副本。
1、網(wǎng)站和設(shè)置標簽
這些設(shè)置控制實際的掃描或爬網(wǎng)。如果要掃描整個站點(即同一域中的每個頁面),則可以忽略此選項卡?赡苄枰{(diào)整一些設(shè)置才能正確掃描您的網(wǎng)站,或者您可能想使用黑名單/白名單將掃描限制在網(wǎng)站的特定部分。
請注意,引擎具有“關(guān)閉但不啟動”規(guī)則。即,如果您從諸如peacockmedia.software/mac/webscraper之類的“目錄”中開始,則掃描將自動僅包括/webscraper中的頁面。
黑名單和白名單規(guī)則允許您設(shè)置規(guī)則以控制掃描范圍。您可以設(shè)置規(guī)則,以使掃描將忽略與特定字符串匹配的鏈接,或者“僅跟隨”與特定字符串匹配的鏈接。(如果您想將掃描范圍限制在某個目錄中,則無需設(shè)置規(guī)則-請參閱上面有關(guān)“關(guān)閉但不能打開”規(guī)則的說明)。您輸入的字符串是“部分匹配”。不是正則表達式,盡管您可以使用某些字符,例如*表示“任意數(shù)量的任何字符”,而$表示“末尾”。
線程數(shù)/限制請求:使用這些設(shè)置來“限制”或限制爬網(wǎng)速度。
線程控制可以同時打開多少個請求。默認值為12,如果服務(wù)器可以應(yīng)付,掃描將很快運行。最大值為50,但實際上,該控件在超過特定點后幾乎沒有差異。如果速率過高,某些服務(wù)器可能會在一段時間后停止響應(yīng)。將此滑塊移到最左邊將把掃描限制在一個線程內(nèi),即在發(fā)送下一個響應(yīng)之前先接收并處理每個響應(yīng)。
這是對匯率的粗暴控制。使用速率限制可能更好(請繼續(xù)閱讀...)
將請求數(shù)限制為每分鐘X:如果您使用此控件,引擎將更智能。它仍將使用少量線程,但會引入計算的延遲,以使請求的總數(shù)不超過您每分鐘設(shè)置的數(shù)目。
如果查詢字符串中的虛假信息或特定的會話ID導(dǎo)致掃描運行的時間比其應(yīng)有的運行時間長得多或永遠持續(xù),則可能需要忽略查詢字符串。
將根域的子域視為內(nèi)部域可讓您決定是否在掃描中包括子域,例如blog.peacockmedia.software
渲染頁面(運行js)如果頁面需要javascript來填充部分或全部內(nèi)容,它可能會在禁用了javascript的瀏覽器中顯示其“noscript”文本,這可能是Scrutiny所看到的。如果您的站點要求打開javascript,則Watchman可以在掃描頁面之前運行javascript。
如果您的頁面包含動態(tài)內(nèi)容,即在瀏覽器中加載頁面然后加載內(nèi)容時,這也很有用。在這些情況下,頁面可能似乎已正確存檔,但是稍后查看時,會顯示新內(nèi)容。“呈現(xiàn)頁面”功能可能會在頁面存檔時“修復(fù)”該內(nèi)容。
掃描會慢得多,并且會占用更多資源,因此只有在絕對確定有必要的情況下,才使用此選項。
請注意,將執(zhí)行腳本,該腳本通常在頁面加載時運行,但是Watchman無法執(zhí)行用戶操作,例如單擊菜單或通過JavaScript搜索鏈接來進行拖網(wǎng)。
嘗試身份驗證Watchman可以檢查某些需要身份驗證的站點。請注意,啟用此設(shè)置可能會損壞您的網(wǎng)站,包括刪除頁面。
對真的。一些內(nèi)容管理系統(tǒng)具有用于管理頁面(包括刪除頁面)的按鈕,這些按鈕看起來像到Watchman的鏈接。我不得不說這是因為它曾經(jīng)發(fā)生過。
如果您要“嘗試身份驗證”,請采取以下預(yù)防措施和好主意:
-嘗試通過使用“不檢查包含的鏈接”來排除此類控件
-確保您不掃描網(wǎng)站的“管理”界面
-使用僅具有“讀者”權(quán)限的用戶帳戶登錄
-確保備份了您的網(wǎng)站并準備好在最壞的情況下進行恢復(fù)
-將您的注銷鏈接列入黑名單(即“忽略”)也很重要,例如,設(shè)置一條規(guī)則,規(guī)定“忽略包含注銷的網(wǎng)址”(或隨你)。
計劃該應(yīng)用程序無需運行,它將在計劃的日期/時間啟動,運行掃描,然后執(zhí)行您選擇的任何完成操作。
從2.9.0版開始,如果重疊,Watchman可以對計劃的掃描進行排隊。但是,如果可以的話,請嘗試安排您的日程表。一次仍然只能運行一個。
記得在更改時間表后按“提交”,這包括切換回“無”。
篩選在發(fā)現(xiàn)并提取每個頁面后,此功能才起作用。在Watchman檢查自上次掃描以來頁面是否已更改之前,此對話框中的過濾器開始起作用。因此,例如,如果您要忽略對導(dǎo)航器/頁眉/頁腳的任何更改,這將很有用;蛘,如果您希望在頁面的特定部分發(fā)生更改時發(fā)出警報。
警報選項/警報時間...。此對話框可讓您決定Watchman會向您發(fā)出哪些更改。例如,您可以指定源代碼或可見文本。您可以定義“可見文本”以包括頁眉,頁腳和導(dǎo)航標簽,替代文本。您也可以選擇收到有關(guān)圖像,css和js等資源,pdf文檔甚至頁面響應(yīng)代碼的更改的警報。
請注意,與“篩選器”選項不同,這些選項僅在顯示警報時才起作用。這些內(nèi)容仍將在歸檔和更改日志中進行輸入。要完全忽略某些更改,必須使用“過濾器”對話框。
警報類型您可以選擇是查看彈出警報(也會彈出?繄D標)還是通知中心橫幅;蚋緵]有警報(更改仍然保存到歸檔文件并記錄下來)。該按鈕當(dāng)前打開“首選項”,這是“警報類型”按鈕所在的位置。
掃描歷史記錄為您提供了對該網(wǎng)站進行的所有掃描的簡單概述。有關(guān)更多詳細信息,請參見“更改”選項卡。
2、變更標簽
在此可以看到自上次掃描以來的更改列表。已更改的所有頁面或資源(取決于“過濾器”設(shè)置)將在此處列出。左右箭頭按鈕使您可以將視圖切換到上一次掃描期間發(fā)現(xiàn)的更改,然后再切換到之前的掃描。
“原因”列將給出諸如“更改為可見文本”或“更改為源代碼”之類的原因。這些顯然將取決于在“站點和設(shè)置”選項卡上的“警報選項”中選中了哪些選項。
原因是“更改為可見文本”或“更改為源代碼”,Watchman可以在兩窗格的“前后”窗口中顯示文本/代碼并突出顯示更改。右鍵單擊(或按住Ctrl鍵單擊)表中的項目,或選擇它并使用“比較”按鈕(右上角)。請注意,此功能當(dāng)前受到限制。如果文本/代碼中有多個更改,并且它們相距很遠,則將從第一個更改的開始到最后一個更改的結(jié)尾突出顯示一大段文本。
如果原因是圖像或文檔已更改,則可以再次以相同的方式并排查看“之前”和“之后”-右鍵單擊/按住Ctrl鍵單擊或“比較”按鈕。
3、存檔瀏覽器標簽
在這里,您可以瀏覽存檔,以查找在“站點和設(shè)置”選項卡中選擇的站點。它具有拆分視圖。左側(cè)是您的頁面列表。右側(cè)就像一個網(wǎng)絡(luò)瀏覽器,它將顯示所選日期顯示的所選頁面。
請注意,頁面列表是可擴展的。在每個頁面下方,您將看到一個日期列表。這些日期不會顯示執(zhí)行掃描的每個日期,而只會顯示該頁面更改的日期。您必須選擇一個日期,然后才能在瀏覽器中看到任何內(nèi)容。
如果列表中有很多頁面,則可以使用搜索框查找特定的網(wǎng)址。
導(dǎo)出頁面為...此按鈕允許您導(dǎo)出正在查看的頁面。您可以選擇導(dǎo)出圖像或包含組成該頁面的文件的文件夾。在后一種情況下,導(dǎo)出的文件將與提取時的文件完全相同,并具有其原始文件名。
導(dǎo)出整個網(wǎng)站是一項強大的功能。它允許您導(dǎo)出整個網(wǎng)站*它出現(xiàn)在某個日期*。顯然,如果僅進行一次掃描,則只有一個日期可供選擇。但是Watchman旨在重復(fù)掃描站點并建立檔案。
導(dǎo)出整個站點將導(dǎo)出與特定日期有關(guān)的存檔“切片”。首先,您必須選擇一個日期。除了選擇日期外,還有一個快捷按鈕,它將選擇最新掃描。您還需要選擇是要“處理”文件,以便可以在Web瀏覽器中離線瀏覽文件,還是“保留”文件并完全按照獲取的方式導(dǎo)出文件。
啟用了javascript此按鈕選擇是否在瀏覽器窗格中啟用javascript。某些頁面要求將此功能打開才能正確顯示。
請注意,如果僅當(dāng)在瀏覽器中啟用javascript時內(nèi)容才能正確顯示,則可能會發(fā)現(xiàn)頁面是動態(tài)生成的。這意味著,每當(dāng)您查看存檔頁面時,您將看到的是當(dāng)前內(nèi)容,而不是歷史內(nèi)容。要“修復(fù)”已存檔的頁面,您可能需要在“站點和設(shè)置”>“渲染頁面(運行js)”處于打開狀態(tài)(以便在掃描時呈現(xiàn)頁面)的情況下進行掃描,然后在瀏覽器中關(guān)閉“啟用javascript”功能。
瀏覽器/源代碼只是在Web瀏覽器視圖和源代碼視圖之間切換存檔瀏覽器。在后一種情況下,您將看到獲取時的源代碼(可能會在瀏覽器中對其進行修改,以便可以脫機查看頁面,但看不到修改后的代碼。)
4、優(yōu)先
在這里您將找到一些全局設(shè)置。
警報類型在下面的站點和設(shè)置中進行描述。
非UI模式或“無頭”模式。當(dāng)計劃的掃描開始時,此模式不會打開窗口,只會顯示狀態(tài)欄圖標/菜單。如果您安排掃描計劃在您可能正在工作且不想中斷應(yīng)用程序啟動時啟動,則此功能很有用。
用戶代理字符串您可以更改用戶代理字符串,以使Watchman看起來像是服務(wù)器的瀏覽器(稱為“欺騙”)。從下拉菜單中選擇一種常規(guī)瀏覽器,或粘貼自己的一種。
如果服務(wù)器提供的網(wǎng)站版本與移動瀏覽器不同,并且您要對該版本進行存檔,則使用移動瀏覽器的UA字符串將很有用。
導(dǎo)出/目錄url默認文件名如果頁面具有類似https://peacockmedia.software/mac/scrutiny/的URL(其中“scrutiny”是目錄),則頁面將在名為“scrutiny”的目錄中創(chuàng)建出口。而且顯然它需要使用文件名在本地保存。“index.html”是默認設(shè)置,但您可以根據(jù)需要進行更改。請注意,擴展名為.php的頁面將添加.html,因為它們不再是php文件,而是固定的html。
額外的js渲染時間此設(shè)置適用于“渲染頁面/運行js”網(wǎng)站設(shè)置。如果您的頁面需要時間來動態(tài)獲取內(nèi)容并顯示它,則可能需要增加此設(shè)置,以確保在Watchman捕獲呈現(xiàn)的內(nèi)容之前所有這些操作都已完全完成。
迅雷影音mac版v3.1.4.66056 官方版
立即下載谷歌瀏覽器Mac版v119.0.6045.105 正式版
立即下載WPS Office蘋果電腦版官方下載v6.1.0 免費版
立即下載優(yōu)動漫paint mac版v1.11.8 官方版
立即下載Cheat Engine Mac版下載v7.4 蘋果電腦版
立即下載企業(yè)微信蘋果電腦桌面端v4.1.0.90666 最新版
立即下載抖音聊天軟件Mac版v1.0.3 最新版
立即下載斗魚Mac客戶端下載v1.3.8 蘋果電腦版
立即下載騰訊先鋒Mac版v1.0.6.0006 最新版
立即下載火狐瀏覽器Mac下載v102.0.0.8209 官方版
立即下載極速PDF閱讀器Mac版下載v1.0 官方版
立即下載winrar mac版下載v1.0.13 蘋果電腦版
立即下載愛思助手mac版本v1.13.010 官方版
立即下載QQ瀏覽器Mac版下載v4.5.123.400 最新版
立即下載關(guān)于騰牛 | 聯(lián)系方式 | 發(fā)展歷程 | 版權(quán)聲明 | 下載幫助(?) | 廣告聯(lián)系 | 網(wǎng)站地圖 | 友情鏈接
Copyright 2005-2024 QQTN.com 【騰牛網(wǎng)】 版權(quán)所有 鄂ICP備2022005668號-1 | 鄂公網(wǎng)安備 42011102000260號
聲明:本站非騰訊QQ官方網(wǎng)站 所有軟件和文章來自互聯(lián)網(wǎng) 如有異議 請與本站聯(lián)系 本站為非贏利性網(wǎng)站 不接受任何贊助和廣告