簡數采集器正則表達式功能:用戶可使用正則表達式提取或者替換匹配內容;
簡數采集器將一些常用的正則表達式列出,方便用戶使用:日期,中文日期,正整數,負整數,正浮點數,負浮點數,網址URL,Email,IP和身份證號。
雙擊采集的字段或者字段右邊的綠色設置按鈕進入數據處理==》轉到 “日期等正則提取” 欄目;
1. 字段原值:采集內容顯示區,可與最下方的 “字段處理后值” 作對比;
2. 常用表達式:點擊該處的按鈕,會出現相應的正則表達式;
3. 將匹配的內容:可填寫要替換的字符串或正則表達式;(該處會匹配原值中符合條件的所有內容)
4. 替換為:如果不填,匹配的內容會替換原值;
如果填寫了,匹配的內容會被填寫的值替換,原值其他內容保持不變;(例子見下方結果)
5. 正則捕獲組:使用捕獲語法提取匹配內容,該處只能提取不能替換;(該處正則只會匹配原值中符合的第一個內容)
6. 多組值分隔符:如果正則捕獲組有多個,填寫的值會作為多個捕獲組間的分隔符;(例子見下方中文日期)
PS:如果不填,則無分隔符;
7. 字段處理后值:該處為正則匹配內容處理后的結果值,根據配置可分三種情況:
——顯示提取匹配的內容;
——顯示原值替換匹配內容后的結果值;
——無匹配到任何內容,為空;
1. 日期
2. 中文日期
3. 網址URL
4. Email
5. 正則替換