https://www.google.com/publicdata/explore?ds=z3bsqef7ki44ac_
2016-01-10
https://www.google.com/publicdata/explore?ds=z3bsqef7ki44ac_
getwd()
## [1] "/home/dlizotte/Seafile/My Library/Teaching/cs4437/Lectures/3_Google Flu Trends"
datatypes = c('POSIXct',rep('numeric',159)) flu_trends <- read.csv("data.txt", comment.char="#", colClasses = datatypes) str(flu_trends)
## 'data.frame': 620 obs. of 160 variables: ## $ Date : POSIXct, format: "2003-09-28" "2003-10-05" ... ## $ United.States : num 902 952 1092 1209 1249 ... ## $ Alabama : num 477 501 492 533 594 ... ## $ Alaska : num NA NA NA NA NA NA NA NA NA NA ... ## $ Arizona : num 606 663 700 819 959 ... ## $ Arkansas : num NA NA NA NA NA NA NA NA NA NA ... ## $ California : num 929 849 1032 1084 989 ... ## $ Colorado : num 233 251 283 310 344 ... ## $ Connecticut : num 223 243 261 268 334 394 459 538 635 1070 ... ## $ Delaware : num NA NA NA NA NA NA NA NA NA NA ... ## $ District.of.Columbia : num 927 993 1033 1089 1177 ... ## $ Florida : num 587 582 606 698 708 ... ## $ Georgia : num 514 532 557 608 745 ... ## $ Hawaii : num NA NA NA NA NA ... ## $ Idaho : num NA NA NA NA NA NA NA NA NA NA ... ## $ Illinois : num 677 732 799 841 978 ... ## $ Indiana : num 544 607 637 680 765 ... ## $ Iowa : num 303 303 312 342 368 ... ## $ Kansas : num 272 270 280 292 313 ... ## $ Kentucky : num 420 442 460 485 496 ... ## $ Louisiana : num 1017 1096 1144 1308 1936 ... ## $ Maine : num NA NA NA NA NA NA NA NA NA NA ... ## $ Maryland : num 1268 1374 1445 1432 1426 ... ## $ Massachusetts : num 344 362 372 367 370 ... ## $ Michigan : num 685 748 791 829 803 ... ## $ Minnesota : num 484 514 588 692 701 ... ## $ Mississippi : num NA NA NA NA NA NA NA NA NA NA ... ## $ Missouri : num 349 359 381 431 452 ... ## $ Montana : num NA NA NA NA NA NA NA NA NA NA ... ## $ Nebraska : num NA NA NA NA NA ... ## $ Nevada : num NA NA NA NA NA ... ## $ New.Hampshire : num NA NA NA NA NA NA NA NA NA 426 ... ## $ New.Jersey : num 695 716 815 831 901 ... ## $ New.Mexico : num NA NA NA NA NA NA NA NA NA NA ... ## $ New.York : num 649 725 739 874 865 ... ## $ North.Carolina : num 565 660 861 852 857 ... ## $ North.Dakota : num NA NA NA NA NA NA NA NA NA NA ... ## $ Ohio : num 616 699 729 759 847 ... ## $ Oklahoma : num 1040 1065 1122 1199 1278 ... ## $ Oregon : num 409 409 428 467 510 ... ## $ Pennsylvania : num 1186 1176 1340 1424 1514 ... ## $ Rhode.Island : num NA NA NA NA NA NA NA NA NA NA ... ## $ South.Carolina : num 462 478 521 529 556 ... ## $ South.Dakota : num NA NA NA NA NA NA NA NA NA NA ... ## $ Tennessee : num 551 597 670 666 717 ... ## $ Texas : num 1398 1517 2010 2786 2917 ... ## $ Utah : num NA NA NA NA NA ... ## $ Vermont : num NA NA NA NA NA NA NA NA NA NA ... ## $ Virginia : num 1112 1198 1343 1448 1556 ... ## $ Washington : num 588 624 777 866 1026 ... ## $ West.Virginia : num NA NA NA NA NA NA NA NA NA NA ... ## $ Wisconsin : num 466 504 538 595 653 ... ## $ Wyoming : num NA NA NA NA NA NA NA NA NA NA ... ## $ HHS.Region.1..CT..ME..MA..NH..RI..VT. : num 322 381 410 397 444 ... ## $ HHS.Region.2..NJ..NY. : num 666 711 819 839 917 ... ## $ HHS.Region.3..DE..DC..MD..PA..VA..WV. : num 1366 1335 1411 1444 1608 ... ## $ HHS.Region.4..AL..FL..GA..KY..MS..NC..SC..TN.: num 631 652 735 822 797 ... ## $ HHS.Region.5..IL..IN..MI..MN..OH..WI. : num 690 775 760 803 931 ... ## $ HHS.Region.6..AR..LA..NM..OK..TX. : num 1385 1613 2089 2583 2955 ... ## $ HHS.Region.7..IA..KS..MO..NE. : num 385 400 422 498 530 ... ## $ HHS.Region.8..CO..MT..ND..SD..UT..WY. : num 266 271 285 338 387 ... ## $ HHS.Region.9..AZ..CA..HI..NV. : num 878 853 1102 1086 1028 ... ## $ HHS.Region.10..AK..ID..OR..WA. : num 624 688 791 852 1012 ... ## $ Anchorage..AK : num NA NA NA NA NA NA NA NA NA NA ... ## $ Birmingham..AL : num 407 402 428 494 531 ... ## $ Little.Rock..AR : num NA NA NA NA NA NA NA NA NA NA ... ## $ Mesa..AZ : num NA NA NA NA NA NA NA NA NA NA ... ## $ Phoenix..AZ : num 757 796 766 820 908 ... ## $ Scottsdale..AZ : num NA NA NA NA NA NA NA NA NA NA ... ## $ Tempe..AZ : num 585 608 629 649 658 ... ## $ Tucson..AZ : num 598 674 731 778 1167 ... ## $ Berkeley..CA : num NA NA NA NA NA NA NA NA NA NA ... ## $ Fresno..CA : num NA NA NA NA NA NA NA NA NA NA ... ## $ Irvine..CA : num NA NA NA NA NA NA NA NA NA NA ... ## $ Los.Angeles..CA : num 901 891 1165 1158 922 ... ## $ Oakland..CA : num 848 888 839 794 908 ... ## $ Sacramento..CA : num 448 436 468 495 525 ... ## $ San.Diego..CA : num 562 840 938 1045 988 ... ## $ San.Francisco..CA : num 1003 1115 1311 1429 1377 ... ## $ San.Jose..CA : num 731 740 826 958 1123 ... ## $ Santa.Clara..CA : num 990 915 989 1020 1070 ... ## $ Sunnyvale..CA : num 602 594 609 604 640 ... ## $ Colorado.Springs..CO : num NA NA NA NA NA NA NA NA NA NA ... ## $ Denver..CO : num 235 270 257 314 354 ... ## $ Washington..DC : num 1153 1310 1309 1151 1285 ... ## $ Gainesville..FL : num NA NA 641 680 679 ... ## $ Jacksonville..FL : num NA NA NA NA NA NA NA NA NA NA ... ## $ Miami..FL : num 373 386 370 380 412 ... ## $ Orlando..FL : num 609 663 615 679 664 ... ## $ Tampa..FL : num 461 581 567 628 593 ... ## $ Atlanta..GA : num 519 484 497 563 845 ... ## $ Roswell..GA : num NA NA NA NA NA ... ## $ Honolulu..HI : num 794 877 1030 1012 910 ... ## $ Des.Moines..IA : num NA NA NA NA NA NA NA NA NA NA ... ## $ Boise..ID : num NA NA NA NA NA NA NA NA NA NA ... ## $ Chicago..IL : num 731 850 799 852 1051 ... ## $ Indianapolis..IN : num 641 657 685 697 715 ... ## $ Wichita..KS : num NA NA NA NA NA NA NA NA NA NA ... ## $ Lexington..KY : num NA NA NA NA NA NA NA NA NA NA ... ## [list output truncated]
library(lattice) xyplot(United.States ~ Date, type=c("p","l"), lwd=2, auto.key=list(columns=3), xlab="Time", ylab="Flu Search Activity\n United States", data=flu_trends)
library(dplyr); library(lubridate); flu_trends_2010 <- flu_trends %>% filter(Date >= ymd("2010-01-01") & Date <= ymd("2010-12-31")) xyplot(United.States ~ Date, type=c("p","l"), xlab="Time", ylab="Flu Search Activity\n United States", data=flu_trends_2010)
library(dplyr); library(lubridate); flu_trends_2010 <- flu_trends %>% filter(Date >= ymd("2010-01-01") & Date <= ymd("2010-12-31")) xyplot(United.States + California + Maine ~ Date, type=c("p","l"), xlab="Time", auto.key=TRUE,ylab="2010 Flu Search Activity", data=flu_trends_2010)
flu_trends_0910 <- flu_trends %>% filter(Date >= ymd("2009-01-01") & Date <= ymd("2010-12-31")) xyplot(United.States + California + Maine ~ Date, type=c("p","l"), xlab="Time", auto.key=TRUE,ylab="2009-2010 Flu Search Activity", data=flu_trends_0910)