推薦幾個精致的字符串處理庫
處理字符串可能是一項繁瑣的工作,因為有許多不同的用例。
例如,一個簡單的任務(wù),如將字符串轉(zhuǎn)換為駱駝字母,可能需要幾行代碼來實現(xiàn)最終目標,比如我們舉個例子:
function camelize(str) {
return str.replace(/(?:^\w|[A-Z]|\b\w|\s+)/g, function(match, index) {
if (+match === 0) return ""; // or if (/\s+/.test(match)) for white spaces
return index === 0 ? match.toLowerCase() : match.toUpperCase();
});
}
上面的代碼片段是StackOverflow中投票最多的答案。但這也不能解決字符串為---Foo---bAr---的情況。

這就是字符串操作庫的用武之地。
字符串操作庫使實現(xiàn)復雜的字符串操作變得很容易,而且還考慮到一個給定問題的所有可能的使用情況。
這對你來說很有幫助,因為你只需要調(diào)用一個方法就能得到一個有效的解決方案。
讓我們來看看幾個JavaScript的字符串操作庫:
String.js Voca Stringz Underscore String Anchorme
一、String.js
該庫是一個輕量級的(大小小于 5 kb的)JavaScript庫,為瀏覽器或Node.js提供額外的String方法。
安裝
npm i string
值得注意的方法
between(left, right)
在左右兩個字符串之間提取一個字符串。當試圖獲得HTML中兩個標簽之間的元素時,可以使用這個方法。
var S = require('string');
S('<a>This is a link</a>').between('<a>', '</a>').s
// 'This is a link'
camelize()
移除任何下劃線或破折號,并將字符串轉(zhuǎn)換為駱駝的大小寫。
這個函數(shù)可以用來解決本文開頭提到的問題。
var S = require('string');
S('---Foo---bAr---').camelize().s;
//'fooBar'
humanize()
將輸入的內(nèi)容轉(zhuǎn)化為對人友好的形式。
這個功能從頭開始實現(xiàn),肯定需要相當多的代碼行。
var S = require('string');
S(' capitalize dash-CamelCase_underscore trim ').humanize().s
//'Capitalize dash camel case underscore trim'
stripPunctuation()
剝離給定字符串中所有的標點符號。
如果你從頭開始實現(xiàn)這個功能,很有可能會漏掉一個標點符號。
var S = require('string');
S('My, st[ring] *full* of %punct)').stripPunctuation().s;
//My string full of punct
更多的方法,參考下面的鏈接:
https://github.com/jprichardson/string.js
二、Voca
Voca是一個JavaScript字符串操作庫。Voca庫中提供了改變大小寫、修剪、填充、審美化、截斷、轉(zhuǎn)義和其他有用的字符串操作方法。
為了減少應(yīng)用程序的構(gòu)建,模塊化設(shè)計允許你加載完整的庫或特定功能。該庫已經(jīng)過完整的測試,有完善的文檔,并提供長期支持。
安裝
npm i voca
值得注意的方法
Camel Case(String data)
將數(shù)據(jù)轉(zhuǎn)換為駱駝的大小寫。
var v = require('voca');
v.camelCase('foo Bar');
// => 'fooBar'
v.camelCase('FooBar');
// => 'fooBar'
v.camelCase('---Foo---bAr---');
// => 'fooBar'
Latinise(String data)
通過刪除變音符對數(shù)據(jù)進行拉丁化處理。
var v = require('voca');
v.latinise('cafe\u0301'); // or 'café'
// => 'cafe'
v.latinise('ao?t décembre');
// => 'aout decembre'
v.latinise('как прекрасен этот мир');
// => 'kak prekrasen etot mir'
isAlphaDigit(String data)
檢查數(shù)據(jù)是否只包含字母和數(shù)字字符。(字母數(shù)字)
var v = require('voca');
v.isAlphaDigit('year2020');
// => true
v.isAlphaDigit('1448');
// => true
v.isAlphaDigit('40-20');
// => false
CountWords(String data)
計算數(shù)據(jù)中的字數(shù):
var v = require('voca');
v.countWords('gravity can cross dimensions');
// => 4
v.countWords('GravityCanCrossDimensions');
// => 4
v.countWords('Gravity - can cross dimensions!');
// => 4
更多的方法,參考下面的鏈接:
https://vocajs.com/#
三、Anchorme.js
這是一個微小的、快速的Javascript庫,有助于檢測文本中的鏈接URLs or Emails,并將其轉(zhuǎn)換為可點擊的HTML錨鏈接。
它有以下幾個優(yōu)點:
它是高度敏感的,誤報率最低。 它根據(jù)完整的IANA列表驗證URL和Emails。 驗證端口號(如果存在)。 驗證IP八位數(shù)(如果存在)。 對非拉丁字母的URLs起作用。
安裝
npm i voca
使用方法
import anchorme from "anchorme";
//or
//var anchorme = require("anchorme").default;
const input = "some text with a link.com";
const resultA = anchorme(input);
//some text with a <a >link.com</a>
你可以傳入額外的擴展來進一步定制該功能。
四、Underscore String
Underscore是JavaScript的字符串操作擴展,它為你提供了幾個有用的功能:capitalize、clean、count、escapeHTML、unescapeHTML、insert、startsWith、 endsWith、titleize、truncate、trim等等。
安裝
npm install underscore.string
值得注意的方法
numberFormat(number)
將數(shù)字格式化為具有小數(shù)和順序分隔的字符串。
var _ = require("underscore.string");
_.numberFormat(1000, 3)
=> "1,000.000"
_.numberFormat(123456789.123, 5, '.', ',');
=> "123,456,789.12300"
chop(string, step)
通過刪除變音符對數(shù)據(jù)進行拉丁化處理。
var v = require('voca');
v.latinise('cafe\u0301'); // or 'café'
// => 'cafe'
v.latinise('ao?t décembre');
// => 'aout decembre'
v.latinise('как прекрасен этот мир');
// => 'kak prekrasen etot mir'
isAlphaDigit(String data)
將給定的字符串切成碎片
var _ = require("underscore.string");
_.chop('whitespace', 3);
=> ['whi','tes','pac','e']
更多的方法,參考下面的鏈接:
http://gabceb.github.io/underscore.string.site/#chop
五、Stringz
這個庫的主要亮點是它能識別unicode。如果你運行下面這段代碼,輸出將是2。
"??".length
// -> 2
至于為什么長度是2,可以在這里閱讀更多關(guān)于JavaScript unicode代碼問題的信息。
https://mathiasbynens.be/notes/javascript-unicode
安裝
npm install stringz
值得注意的方法
limit(string, limit, padString, padPosition)
將字符串限制在一個給定的寬度。
const stringz = require('stringz');
// Truncate:
stringz.limit('Life’s like a box of chocolates.', 20);
// "Life's like a box of"
// Pad:
stringz.limit('Everybody loves emojis!', 26, '??');
// "Everybody loves emojis!??????"
stringz.limit('What are you looking at?', 30, '+', 'left');
// "++++++What are you looking at?"
// Unicode Aware:
stringz.limit('??????', 2);
// "????"
stringz.limit('????????', 4, '????');
// "????????????????"
toArray(string)
將字符串轉(zhuǎn)換為數(shù)組。
const stringz = require('stringz');
stringz.toArray('abc');
// ['a','b','c']
//Unicode aware
stringz.toArray('????????');
// ['????', '??', '??']
更多的方法,參考下面的鏈接:
https://github.com/sallar/stringz
往期推薦
