Brz početak rada sa R: Dijagram rasturanja sa regresionom linijom (26. Deo)

Danas ćemo kreirati dve promenljive, grafički ih prikazati na dijagramu rasturanja i uključiti regresionu liniju. Neka je visina promenljiva koja opisuje visinu (u cm) deset ljudi. Da bismo kreirali ovu promenljivu kopirati i preneti sledeći kod na R komandnu liniju.
visina <- c(176, 154, 138, 196, 132, 176, 181, 169, 150, 175)
Neka je težina promenljiva koja opisuje težinu (u kg) istih deset ljudi. Da bismo kreirali promenljivu težina kopirati i preneti sledeći kod na R komandnu liniju.
težina <- c(82, 49, 53, 112, 47, 69, 77, 71, 62, 78)
Obe promenljive su sačuvane u R random prostoru. Da bismoih prikazali unesimo sledeće:
visina
težina

Sada možemo kreirati jednostavan grafik (dijagram rasturanja) sa ove dve promenljive kao što sledi:
plot(težina, visina)

Možemo poboljšati ovaj grafik korišćenjem različitih argumenata unutar plot() komande. Kopirati i preneti sledeći kod u R radni proctor:
plot(težina, visina, pch = 16, cex = 1.3, col = "blue", main = "DIJAGRAM RASTURANJA: VISINA PREMA TEŽINI", xlab = "TEŽINA (kg)", ylab = "VISINA (cm)")

U gornjem kodu sintaksa pch = 16 kreira ispunjene tačke, dok cex = 1.3 crkreira tačke koje su 1.3 puta veće nego njihova podrazumevajuća vrednost (gde je cex = 1). Kasnije ćemo reći nešto više o ovim komandama.
Ocenimo regresioni model koristeći lm() na dve promenljive dodavajući sledeći tekst u komandnu liniju:
lm(visina ~ težina)

We see that the intercept is 98.0054 and the slope is 0.9528. Uzgred – lm označava “linearni model”.
Naposletku, možemo dodati regresionu liniju na naš grafik unošenjem sledećeg teksta u komandnu liniju:
abline(98.0054, 0.9528)
Sledeća komanda će takođe dodati regresionu liniju na dijagram rasturanja:
abline(lm(visina ~ težina))

Ništa od ovoga nije bilo teško! U sledećem delu ponovo ćemo razmotriti regresiju.
David

Dodatak: Korišćeni R kodovi

# Kreirati promenljivu visina. 
visina <- c(176, 154, 138, 196, 132, 176, 181, 169, 150, 175)

# Kreirati promenljivu težina. 
težina <- c(82, 49, 53, 112, 47, 69, 77, 71, 62, 78)

# Prikazati obe promenljive. 
visina
težina 

# Kreirati dijagram rasturanja promenljive visina prema promenljivoj težina. 
plot(težina, visina)

# Kreirati kompletniji dijagram rasturanja promenljive visina prema promenljivoj težina.
plot(težina, visina, pch = 16, cex = 1.3, col = "blue", main = "DIJAGRAM RASTURANJA: VISINA PREMA TEŽINI", xlab = "TEŽINA (kg)", ylab = "VISINA (cm)")

# Oceniti regresioni model sa ove dve promenljive.
lm(visina ~ težina)

# Dodati regresionu liniju na dijagram rasturanja. 
abline(98.0054, 0.9528)

# Alternativno, regresiona linija se može dodati korišćenjem sledeće naredbe: 
abline(lm(visina ~ težina))