Hoe te Strings Split in R

Een verzameling van gecombineerde letters en woorden heet een string. Als je werkt met tekst, moet je in staat zijn om woorden aaneen te schakelen (string ze samen) en splitsen ze uit elkaar. In R, de pasta () functie gebruikt u om aaneenschakelen en de strsplit () functie op te splitsen. In dit gedeelte tonen we u hoe u beide functies te gebruiken.

Maak eerst een karakter vector genaamd pangram, en wijs de waarde "De snelle bruine vos springt over de luie hond", als volgt:

> Pangram <- "De snelle bruine vos springt over de luie hond"
> Pangram
[1] "De snelle bruine vos springt over de luie hond"

Om deze tekst aan het woord grenzen (spaties) gesplitst, kunt u strsplit () als volgt gebruiken:

> Strsplit (pangram, "")
[[1]]
[1] "De" "snelle" "bruin" "vos" "sprongen" "over" "het" "lui" "hond"

Merk op dat de ongebruikelijke eerste regel van strsplit () â € s-uitgang bestaat uit [[1]]. Vergelijkbaar met de manier waarop R weergeeft vectoren, [[1]] betekent dat R toont het eerste element van een lijst. Lijsten zijn zeer belangrijke begrippen in R; ze laten je allerlei variabelen te combineren.

In het voorgaande voorbeeld, deze lijst slechts een enkel element. Ja, thata € s rechts: De lijst heeft één element, maar dat element is een vector.

Om een ​​element te extraheren uit een lijst, moet u dubbele vierkante haken te gebruiken. Splits uw pangram in woorden, en wijs het eerste element om een ​​nieuwe variabele genaamd woorden, met behulp van dubbele vierkante haakjes ([[]]) subsetting, als volgt:

woorden <- strsplit (pangram, "") [[1]]
> Woorden
[1] "De" "snelle" "bruin" "vos" "sprongen" "over" "het" "lui" "hond"

Om de unieke elementen van een vector, met inbegrip van een vector van de tekst te vinden, de unieke () functie te gebruiken u. In de variabele woorden, "het" verschijnt twee keer: één keer in kleine letters en een keer met de eerste letter een hoofdletter. Om een ​​lijst van de unieke woorden te krijgen, eerst converteren woorden naar kleine letters en dan uniek te gebruiken:

> Unieke (tolower (woorden))
[1] "de" "snelle" "bruin" "vos" "sprongen" "over" "lui"
[8] "hond"


© 2019 Quilcedacarvers.com | Contact us: webmaster# quilcedacarvers.com