seqinr

DNAやアミノ酸配列を解析するためのパッケージ

一部関数がbio3dパッケージとコンフリクトするので注意。

導入方法

常法通りにインストール。

install.packages("seqinr", dep=TRUE)

インストール出来たら、library()で読み込む。

library(seqinr)

read.alignment

配列を含むファイルを読み込む。読み込まれた要素はalignmentクラスのオブジェクトとなる。

read.alignment(file, format)
引数 説明
file ファイルのパス
format ファイルのフォーマット。“mase”, “clustal”, “phylip”, “fasta”, “msf"のいずれか。

戻り値は以下の内容を含むリストとなる

names属性 説明
nb 配列の数
nam 各配列の名前ベクトル
seq 各配列のリスト
com 各配列のコメント。コメントが無い場合はNAを返す。

使用例

> AKTalign <- read.alignment("AKT.fasta", format="fasta")

> AKTalign$nb
[1] 3
> AKTalign$nam
[1] "P31749.2" "P31751.2" "Q9Y243.1"
> AKTalign$seq[[1]]
[1] "msdvaivkegwlhkrgeyiktwrpryfllkndgtfigykerpqdvdqreaplnnfsvaqcqlmkterprpntfiirclqwttviertfhvetpeereewttaiqtvadglkkqeeeemdfrsgspsdnsgaeemevslakpkhrvtmnefeylkllgkgtfgkvilvkekatgryyamkilkkevivakdevahtltenrvlqnsrhpfltalkysfqthdrlcfvmeyanggelffhlsrervfsedrarfygaeivsaldylhseknvvyrdlklenlmldkdghikitdfglckegikdgatmktfcgtpeylapevledndygravdwwglgvvmyemmcgrlpfynqdheklfelilmeeirfprtlgpeaksllsgllkkdpkqrlgggsedakeimqhrffagivwqhvyekklsppfkpqvtsetdtryfdeeftaqmititppdqddsmecvdserrphfpqfsysasgta"
> AKTalign$com
[1] NA

read.fasta

FASTA形式のDNA配列やアミノ酸配列を読み込む。読み込まれた要素はSeqFastadnaクラスもしくはSeqFastaAAクラスのオブジェクトとなる。

read.fasta(file, seqtype, as.string)
引数 説明 初期値
file system.file()関数を使用してファイルを指定する。
seqtype DNA配列(“DNA”)かアミノ酸配列(“AA”)を指定する。 “DNA”
as.string 配列を文字列として格納する真偽値。FALSEの場合は、1文字ずつ格納される。 FALSE

戻り値はSeqFastadnaクラスまたはSeqFastaAAクラスのオブジェクトとなる。

使用例

AKTfasta <- read.fasta(
"AKT.fasta"
,	seqtype="AA"
)

AAstat

タンパク質のアミノ酸残基数や等電点を計算する。

AAstat(seq)
引数 説明
seq 大文字で書かれたタンパク質配列のベクトル

戻り値は以下の内容を含むリストとなる

names属性 説明
Compo 各アミノ酸の頻度を含むfactor
Prop アミノ酸の物性による分類ごとの割合
Pi 等電点
> AAstat(AKTseq$P31749.2)
$Compo

* A C D E F G H I K L M N P Q R S T V W Y 
0 25 7 28 49 27 30 13 20 36 41 16 13 22 17 30 23 30 28 7 18 

$Prop
$Prop$Tiny
[1] 0.2395833

$Prop$Small
[1] 0.4291667

$Prop$Aliphatic
[1] 0.1854167

$Prop$Aromatic
[1] 0.1354167

$Prop$Non.polar
[1] 0.5020833

$Prop$Polar
[1] 0.4979167

$Prop$Charged
[1] 0.325

$Prop$Basic
[1] 0.1645833

$Prop$Acidic
[1] 0.1604167


$Pi
[1] 5.751068

See Also

msa

多重配列アライメントを行うためのパッケージ

bio3d

タンパク質の配列や構造を解析するためのパッケージ

tidyr

データをtidyに整形する

swirl

インタラクティブにRを学ぶ。

dplyr

データフレームを操作するためのパッケージ

jsonlite

JSONを処理するためのパッケージ

xml2

XMLを扱うためのパッケージ

rjson

JSONデータを処理するためのパッケージ